BMC Biology | 徐書華團隊解析苗瑤人群的遺傳起源與基因紐帶

智人從北部進入東亞,攜帶丹尼索瓦和尼安德塔古人群的基因。在黑龍江流域形成EDAR V370A基因突變。攜帶石葉技術和玉器向周邊擴散。萬年前,粟黍農業從東北開始擴散,形成泛歐亞語係(包括日韓通古斯蒙古突厥語),粟黍農民進入黃河流域形成漢藏語。粟黍農民進入西藏,川滇地區等等。

https://life.fudan.edu.cn/26/ce/c28140a665294/page.htm

BMC Biology | 徐書華團隊解析苗瑤人群的遺傳起源與基因紐帶

發布時間:2024-03-13瀏覽次數:587

2024年3月13日,國際學術期刊BMC Biology在線發表了複旦大學徐書華團隊的研究成果“Reconstructing the ancestral gene pool to uncover the origins and genetic links of Hmong–Mien speakers”。該項研究基於現代苗瑤人群全基因組測序數據,建立新方法重構苗瑤語係人群的祖源基因庫,結合亞洲地區的現生人群與古人基因數據係統分析苗瑤人群的遺傳結構及複雜演化曆史,從遺傳學角度分析和揭示了苗瑤語係遺傳起源以及苗瑤人群的基因紐帶。

 

苗瑤人群主要分布在我國南部及東南亞地區,是中華民族中不可或缺的重要組成部分。苗瑤語的分類和歸屬在語言學界一直具有較大爭議。不少學者認為苗瑤語是獨立語係,即苗瑤語係,而一些學者則認為苗瑤語是屬於漢藏語係的語族,即苗瑤語族。不同學者對於苗瑤語的內部分類也在細節上有不同的看法,其中關於佘語究竟是歸屬於苗語支(族)還是瑤語支(族)也是爭議較多問題。遺傳學研究很早就發現了語言與基因之間的密切關係。該項研究正是通過群體遺傳學分析厘清現生苗瑤人群的親緣關係並以基因譜係為信息載體追溯苗瑤人群的起源和演化曆史,並對苗瑤語係人群的基因組多樣性本身進行了係統分析,尋找苗瑤人群基因組中保留的特征性基因變異,推斷這些古老族群的演化曆程及其背後的機製。

 

該項研究基於80例來自廣西地區瑤族人群樣本的全基因組深度測序數據,結合包括苗瑤語係中苗族、佘族在內的28個現代東亞人群及968個亞洲地區古人樣本基因數據,通過新方法重構苗瑤人群祖先基因組,揭示了苗瑤人群的遺傳結構及複雜演化曆史,並檢測到若幹可能與苗瑤人群環境適應相關的潛在功能變異。

 

研究團隊首先對現代苗瑤人群遺傳結構進行了解析,苗族、瑤族、佘族三個主要苗瑤分支代表人群在遺傳上同源,但從全基因組數據中可識別出群體水平的遺傳差異。苗族、佘族相比瑤族具有更多北方遺傳祖源。進一步研究表明,苗瑤亞群的形成是由局部區域的人群混合驅動。如,瑤族主要生活在廣西,受到壯族人群的遺傳混合;苗族主要生活在貴州、湖南,受到土家族的基因流影響;佘族主要生活在福建、浙江,位於沿海地區,其基因組相比苗族和瑤族表現出更明顯的人群隔離特征。更為有趣的是,通過比較遺傳相似性,發現三個苗瑤亞群在曆史上各自與遺傳背景有所不同的漢族人群發生過基因交流,可能反映了各自與臨近地區的漢族人群的遺傳交融。為了探究苗瑤人群的父係及母係起源,該研究針對X/Y染色體及線粒體DNA(mtDNA)進一步深入分析。其中,Y染色體上可檢測到苗瑤人群特異性O-N5父係單倍型,即該父源譜係在苗瑤人群中高頻存在但在其他人群中較為罕見,然而線粒體上未發現明顯的苗瑤人群特異性譜係,這意味著現代苗瑤人群的母係祖源可能是多樣的。進一步比較常染色體與X染色體的遺傳成分發現,苗瑤人群可能經曆了性別偏向性混合,即更偏向於北方女性和南方男性的基因交融模式。此外,無論是常染色體還是Y染色體或語言學證據,都表明瑤族首先從苗瑤人群的共同祖先中分離。因此,在語言學中關於佘語究竟是歸屬於苗語支(族)還是瑤語支(族)也是爭議較多問題,該研究中的遺傳學分析結果是支持操持佘語的佘族與操持苗語的苗族人群親緣關係更近一些,從而表明遺傳學證據是支持前者的。基於這些發現,研究團隊構建了苗瑤人群的遺傳演化模型(圖 1),苗瑤人群的共同祖先可追溯至距今5800年前。通過與古DNA數據的聯合分析,結果表明苗瑤人群可能發源自長江中下遊流域。

 

此外,該研究揭示了苗瑤人群與侗傣人群、漢族人群的緊密親緣關係。其中,苗瑤人群與侗傣人群共享同一種主要遺傳祖源,這種遺傳成分也在南方漢族人群中高頻存在,在北方漢族人群中卻較為罕見。結合共享遺傳漂變分析的結果推斷,漢族人口擴張前與苗瑤祖先人群有過一定程度的基因交流。通過估計人群遺傳分化時間,結果表明苗瑤人群與侗傣人群的共同祖先可追溯至8200年前,與漢族人群的共同祖先可追溯至10800年前。

 

圖 1 苗瑤人群的起源及演化模型

 

值得注意的是,在這項研究中研究團隊開發出了基於現代人群基因組重構祖先基因組的新方法(圖 2),並重構了苗瑤人群的祖先基因組。遺傳學研究中對古人群的研究依賴古DNA樣本,但古DNA樣本獲取困難、樣本量小、族群歸屬不明、數據質量參差不齊的缺陷限製了古人群的深入研究,而該研究發展的新方法通過局部祖源推斷從現代苗族、瑤族、佘族人群的基因組中標記並提取苗瑤人群的共祖序列片段,,進而通過片段拚接形成完整基因組。該方法在片段組裝時著重考慮並結合了近期的序列連鎖關係,同時對基因組上的祖源片段低覆蓋區域進行了質控。基於該方法產生的古人群數據具有樣本規模大、基因組覆蓋度高、適用範圍廣等優點,有望促進古人群基因組及遺傳學的深入研究。在與現代人群的整合分析中,重構的苗瑤祖先基因組表現出鮮明的苗瑤遺傳特征,並作為一種東亞人群底層遺傳祖源,在東亞特別是東亞南部人群中普遍存在。在自然選擇信號的識別中,采用重構的苗瑤祖先基因組能在一定程度上抹除近期人群混合或其他混雜因素對選擇信號的掩蓋,其與傳統檢測方法聯用,可顯著提高自然選擇信號的檢出效力。因此,該方法為揭示群體遺傳結構、推斷族群演化遺傳曆史、檢測自然選擇信號等方麵提供了技術支撐。

 

圖 2 基於現代人群重構祖先基因組流程圖

 

最後,研究團隊通過多種自然選擇信號檢測方法識別出大量可能與苗瑤人群環境適應相關的自然選擇信號位點。其中包括位於GJB2基因上與耳聾發生相關的錯義突變rs72474224(錯誤:引用源未找到),該風險等位基因在苗瑤人群中高頻存在,但在其他人群中罕見或缺失。存在某種外力使得該有害變異在苗瑤人群中頻率抬升,可能有著基因多效性存在。此外,研究團隊在瑤族人群中識別到七個顯著富集強效應罕見變異的基因,並表現出家族聚集性。這些基因對瑤族人群中的遺傳效應有待進一步研究。

 

圖 3rs72474224表現出人群特異性正選擇信號

 

遺傳學與語言學的關係非常複雜。有些人群的語係關聯源自文化傳播,有些人群的語言演化與遺傳演化相伴,這項研究發現苗瑤人群的語言發展更傾向於後一種演化模式。這種演化不僅發生在苗瑤人群內部,已發生在苗瑤人群與漢族之間。甚至還有一些苗族、瑤族說各種未被分類的漢語方言。苗瑤人群經曆了複雜的遺傳演化及語言發展,這項研究對苗瑤人群的遺傳演化的深度解析為相關研究的開展提供了重要支撐。複旦大學人類表型組研究院博士後高揚和複旦大學生命科學學院科研助理張曉曦為本文共同第一作者,複旦大學/附屬中山醫院徐書華教授為通訊作者,國科大畢業生陳豪博士、馬森博士,複旦大學陸豔副研究員、楊亞軍教授、張夢翰青年研究員,作為論文作者對該工作的開展和完成給予了大力支持並做出重要貢獻。

該項工作獲得了國家重點研發計劃、國家自然科學基金等多項基金的資助。該項工作在獲得國家人類遺傳資源管理部門審核許可(2022BAT1948)前提下依據國際慣例公開研究數據。

 

文章鏈接:https://doi.org/10.1186/s12915-024-01838-9

https://bbs.wenxuecity.com/memory/1659010.html

距今6300年左右!紅山文化早期龍形蚌飾成功複原

請您先登陸,再發跟帖!