王傳超,李輝
複旦大學 生命科學學院 現代人類學教育部重點實驗室
原載於Investigative Genetics, 2013, 4(1):11, 王傳超 譯。
摘要:東亞人群有著極其豐富的遺傳、體質、文化和語言多樣性,但這些多樣性的具體分布狀況以及相互間的淵源關係仍有待進一步解析。隨著東亞及其周邊人群的分子人類學數據的不斷積累,尤其是父係Y染色體研究的一係列進展,使得東亞人群的多樣性結構逐漸明晰。現有的Y染色體數據揭示,現代人出非洲後由東南亞經多次遷徙進入東亞。在舊石器時代,現代人最初定居東亞之後,緊接著不斷北遷,這奠定了東亞遺傳結構的基礎。隨後,來自中亞的移民與東亞人群的基因交流增大了東亞的南北人群間遺傳距離。語言、農業、軍事與社會地位等文化因素同樣影響著東亞的遺傳結構。將Y染色體與家譜文獻相結合也為遺傳學研究人類古代曆史提供了可能。
關鍵詞:東亞人群,Y染色體,遷徙,遺傳結構
東亞是亞洲的一部分,麵積廣闊、風光旖旎。東亞有著占世界22%的人口,主要分為四種體質類型:新石器時代東亞人,即蒙古人種;舊石器時代大洋洲人,即澳大利亞人種;舊石器時代東南亞人,即尼格利陀人種;還有歐洲人即高加索人種。東亞有阿爾泰、南亞、南島、侗傣、苗瑤、漢藏和印歐等七個語係的200多種語言。這使得東亞成為世界上研究人類進化、遺傳多樣性和基因與文化相互作用的最重要區域之一[1]。
在過去數年中,分子人類學的研究者們通過使用常染色和X染色體、父係Y染色體、母係線粒體等等各類遺傳標記體係來解析東亞人群的遺傳多樣性。常染色體和X染色體遺傳自父母雙方,會被重組所打亂,而Y染色體上主幹的非重組區呈嚴格父係遺傳,並且Y染色體的“有效群體大小”理論上至多為常染色體的四分之一,X染色體的三分之一,對漂變非常敏感,容易形成群體特異性多態標記,從而包含更多的關於群體曆史的信息。Y染色體的這些特點使其成為研究人類進化和遷徙最強有力的工具之一[2,3]。
Y染色體進入人們的視野,開始於其在追溯現代人起源上的應用。自上世紀90年代以來,人類學界爭論最激烈的話題,是東亞地區現代人的起源問題。由於東亞出土了大量的古人類化石,一些人類學家認為東亞地區的人類是本土連續進化的,支持全球現代人的多地區起源。然而,1999年宿兵等人[4]采用Y染色體非重組區的19個SNP來研究東亞人群,得出東亞地區現代人起源於非洲,並由南方進入東亞,而後向北方遷。隨後,2000年柯越海等人[5]的對東亞地區12127份男性隨機樣本的Y染色體進行SNP分型研究。Y染色體突變M168被認為約是7.4萬年前現代人走出非洲時所產生的突變,其原始型僅出現在東非人群中,除非洲以外的人群都是突變型。柯越海等人的研究雖然沒有直接檢測M168這個突變,但他們檢測了M89、M130和YAP這三個M168 下遊的突變。結果顯示這一萬多份樣品無一例外都帶有M89、M130和YAP三種突變之一,也就是說都是M168突變型。盡管現在來看,東亞現代人或也與一些古人種有基因交流,但從父係角度看,現存的東亞人群都是走出非洲的後裔,這是支持現代人非洲單一起源的強有力的遺傳學證據。下一問題就要回答早期現代人是如何遷徙來到東亞的。
人群的遷徙和分布與氣候的變遷有著密切的關係,為便於從不同角度探索和認識人群演變規律,我們這裏介紹一些近10萬年來的氣象學的材料。在距今約11萬-1萬之間,也就是考古學上的舊石器時代到中石器時代,地球處於末次冰期[9],那段時間,海平麵遠低於現在,許多現在的島嶼與大陸相連,成為了人類遷徙的重要通道。距今2.65萬年到1.9-2萬年是末次冰盛期,是末次冰期中氣候最寒冷、冰川規模最大的時期,亞洲的絕大部分、北歐和北美都被冰雪覆蓋,人類的生存空間也隨冰川蔓延而逐漸縮小。大約1.5萬年前,氣溫開始轉暖,冰川也開始退卻,現代人才迎來了遷徙的黃金時期[10,11]。
本文中,我們主要應用Y染色體的數據來分析東亞人群的遷徙曆史,並探討現代人最初定居東亞及其後的遷徙和擴張模式、微進化曆程等。
北方路線還是南方路線?
現階段比較一致的看法是東亞的歐洲人種類型來自西北[10, 12]、澳大利亞人和尼格利陀人來自東南[4,10],最具爭議的還是蒙古利亞人來自哪裏。有三種可能的模式:1)蒙古利亞人由北向南遷徙,與東南亞和中國南方的尼格利陀和澳大利亞人種混合;2)蒙古利亞人來自南方;3)北方人群來自北方,南方人群來自南方,自1萬多年前的晚更新世以來,蒙古利亞人在南北方共同進化[13]。Y染色體是解決這一爭議的有力工具。
Y染色體可以分為20種主幹單倍群,編號從A到T(P可能不存在),其中O-M175, C-M130, D-M174和N-M231是東亞四個主要單倍群,約占到東亞全部男性的93%(圖1)。其他單倍群,例如E-SRY4064, G-M201, H-M69, I-M170, J-P209, L-M20, Q-M242, R-M207和T-M70僅占到東亞男性的7% [12]。
圖1. Y 染色體總單倍群C、D、N和O在東亞的地理分布。
O-M175是東亞最大的單倍群,約75%的中國人以及超過50%的日本人都可歸到這一類型下,因此有理由認為它代表著蒙古利亞人。O-M175分出三個主要的下遊單倍群O1a-M119、O2-M268以及O3-M122,這三個單倍群約占到東亞男性的60% [14,15]。O1a-M119在中國東南沿海、侗傣族群、台灣原住民中集中分布 [16]。O2-M268約在漢族中占5%以上 [14],O2a1-M95是O2下的主要支係,在華南、南方少數民族、中南半島及印度門噠人群中分布較多 [16,17]。O2b-M176是O2下的另一支係,最主要集中於朝鮮半島、朝鮮族和日本彌生人,越南人和漢族中也有少量分布 [18,19]。O3-M122是中國最常見的單倍群,遍及整個東亞和東南亞,占漢族50-60%左右。O3a1c-002611、O3a2c1-M134和O3a2c1a-M117是O3下的三個主要支係,各占到漢族的12-17%左右。O3a2c1a-M117在藏緬族群中也有較多分布。O3下的另一支係O3a2b-M7在苗瑤和孟高棉人群中高頻出現,但在漢族中卻不足5% [14,15]。
宿兵等[4]在亞洲大範圍群體樣本中對包括M119、M95和M122在內的19個Y染色體SNP位點以及三個STR位點進行了檢測。在隨後的主成分分析中,北方人群緊密聚在一起,且都被包含在南方人群的聚類簇之內,南方人群比北方人群多樣性更高。他們認為北方人群來自於舊石器時代定居南方的南方人群。他們還使用STR位點的一步突變模式和0.18%突變率估算O3-M122這一單倍群的時間為1.8-6.0萬年,這一時間可能反映的是最初定居東亞的瓶頸時期。2005年,石宏等[15]對東亞多個群體的2000多個O3樣本進行了更係統的研究,他們的研究也發現南方群體中的O3-M122的多樣性高於北方,支持O3-M122的南方起源。他們進一步使用均方差(ASD)方法和STR的進化突變率(0.00069每位點每25年)[20,21]估算O3支係北遷的時間為2.5-3.0萬年。最近,蔡曉雲等[22]對東南亞的孟高棉和苗瑤族群中的O3a2b-M7和O3a2c1a-M117進行了係統研究,揭示其在1.9萬年前末次盛冰期時候經由東南亞進入東亞的單向瓶頸擴散[22]。O3下的另一主要支係O3a1c-002611的STR位點多樣性也與其他兄弟支係一樣有著大體上的自南向北遞減的趨勢[23]。總體來看,絕大多數證據都支持Y染色體單倍群O3-M122經由南方路線進入東亞並逐漸向北擴散(圖2)。
圖2. Y 染色體單倍群C、D、N和O在東亞的遷徙。虛線表示另外可能的遷徙路線。
東亞最早的定居者
東亞的特征單倍群O-M175的產生時間,由足夠多的STR的位點估算很可能不超過3萬年,因此單倍群O很可能根本不是東亞最早的定居者。單倍群C-M130的人群卻極可能是最早到達東亞的人群。單倍群C從阿拉伯半島南部、巴基斯坦、印度、斯裏蘭卡、東南亞、東亞、大洋洲到美洲都有分布,尤其在遠東和大洋洲高頻分布,但在撒哈拉以南的非洲沒有被發現(圖1)。C下遊的分支,例如C1-M8、C2-M38、C3-M217、C4-M347、C5-M356和C6-P55,都有著區域特異性分布[24]。C3-M217是分布最廣的支係,在蒙古和西伯利亞群體中最高頻出現。單倍群C1僅在日本人和琉球人中出現,但頻率很低,還不足5%。單倍群C2出現在從印度尼西亞東部到波利尼西亞的太平洋島嶼人群,尤其是在波利尼西亞的一些群體中,且由於連續的奠基者效應和遺傳漂變而成為了上述地方的特征單倍群[19,25]。C4幾乎僅局限在大洋洲的澳大利亞原住民中。C5在印度及其周邊的巴基斯坦和尼泊爾等地低頻出現[26,27]。C6則僅出現在新幾內亞高地上[28]。單倍群C的分布模式說明了這個單倍群很可能是在亞洲大陸起源,且那時還沒到達東南亞。
為更清楚說明單倍群C的源流,鍾華等[24]對取自東亞和東南亞140多個群體的465個單倍群C的樣本檢測了C內部的12個SNP和8個STR位點。他們發現C3的STR多樣性最高出現在東南亞,且呈自南向北、自東向西遞減的趨勢,ASD方法估算時間落在3.2-4.2萬年間,這表明了舊石器時代C3是沿海岸線逐漸向北擴張的(圖2)。單倍群C很可能在6萬年前就已到達東南亞和澳大利亞,比其向北擴散的時間要早得多,這也就是說單倍群C在蒙古利亞人(單倍群O)來之前的就已在東亞生活了數萬年。經過如此長的時間,單倍群C的人群或已與蒙古利亞人有著不同的體質特征。因為現在單倍群C的人群多有著澳大利亞人的體質特征,例如澳大利亞原住民、巴布亞人和一些達羅毗荼人,所以我們認為單倍群C是由澳大利亞人體質特征的人帶來的,他們達到遠東的時間要早於其他現代人。北京周口店出土的1萬年前的人骨就有著澳大利亞人的體質特點,或也支持澳大利亞人是東亞最早定居者。
東亞的黑人遺存
最具神秘色彩的是Y染色體單倍群D的遷徙曆史,迄今為止我們仍對此知之甚少。單倍群D是從非洲的DE-M1(YAP插入)單倍群衍生出來的,很可能與矮黑體質的尼格利陀人相關聯。單倍群E是D的兄弟支係,E隨著高黑人西遷非洲,D則可能由矮黑人東遷帶到東亞(圖3)。
圖3. Y染色體譜係的主幹以及其與不同體質特征的現代人可能聯係。
單倍群D-M174在安達曼尼格利陀人、北部藏緬群體和日本的阿伊努人中高頻分布,在其他東亞、東南亞和中亞群體也有低頻分布(圖1)[17,19,29,30]。D下分D1-M15、D2-M55和D3-P99三個主要支係,還有許多未明確定位的小支係。D1在藏族、羌語支和彝語支人群中廣泛分布,在東亞其他群體中也有低頻分布[31,32]。D2僅分布於日本,占日本40%以上,是上古繩文人的主要成分。D3在青藏高原東部(康區)、白馬人及納西族等群體中高頻 [31]。D*多在安達曼群島被發現[30],且已被隔離了至少2萬年。其他一些被包含在D*中的小支係也多分布於西藏周邊藏緬語人群、東南亞人群,阿爾泰人中也有少量來源不明的D*。這些D*的內部譜係需要詳細調查分析。單倍群D高頻人群的膚色大多較深,包括安達曼人、一些藏緬和孟高棉人等。阿伊努人膚色變白可能是為了吸收更多紫外線以適應高緯度地區生存。
對於單倍群D的起源,Chandrasekar等認為CT-M168在南亞分出了YAP插入和D-M174突變,因為他們在印度東北一些族群中發現有YAP插入而在安達曼群島上檢測到了M174突變 [33]。這樣來看,同樣帶有YAP插入的E單倍群也很可能是亞洲起源,但沒有證據進一步支持。如果單倍群D誕生於非洲,那非常有趣的是它是如何隨著總單倍群CF的群體來到東亞的?
另一不可思議的是單倍群D是如何由東亞的西南角一路去到日本的。它可能通過東亞大陸北上,還可能是經由巽他大陸,但穿過東亞大陸似乎更近。石宏等人推論單倍群D北上擴張到中國西部的時間約在6萬年前(ASD方法),要早於東亞其他主要支係的遷徙。隨後,這一先頭部隊可能通過北向路線經由朝鮮半島到達日本,或者通過南向路線經由台灣和琉球所形成的大陸橋到達日本,這一過程中他們可能與澳大利亞人相遇過。後來單倍群O的北上以及新石器時代漢族擴張,單倍群D的主體人群可能就被擠出了中國東部 [31]。但是無論是遺傳學上還是考古學上都沒有任何證據表明D2或尼格利陀人曾到過中國大陸東部。相反,從馬來半島到波利尼西亞的巽他大陸至今仍有大量的尼格利陀人。尼格利陀人或許在舊石器晚期占據了整個巽他大陸。那麽,這些人群可能直接從菲律賓到台灣和琉球。唯一難以解釋的是在菲律賓的尼格利陀人中從未發現過D的存在,他們的父係或許已在約1.8萬年前(BATWING方法)被來自於巴布亞島的C2和K的擴張所取代[34],當然也可能被非常晚近時期來自於東亞大陸的單倍群O所替換[35]。因為相關數據的不足,東亞的黑人遺存-單倍群D的源流還遠未揭開。
往來西北的遷徙
單倍群O的兄弟支係是單倍群N-M231,單倍群N在歐亞大陸北部,尤其是包括芬蘭、烏戈爾、薩摩耶德和尤卡吉爾等分支的烏拉爾語人群、以及阿爾泰語人群和愛斯基摩人中高頻分布,它還低頻出現在東亞內陸(圖1)[29,36]。對於單倍群N 的詳細分析顯示,N 在東歐的高頻是緣於很晚近的遷徙,這次遷徙約從1.2萬到 1.4萬年前(ASD方法)開始,由內亞/南西伯利亞出發,走一條逆時針的北部路線 [36]。N的下遊分支N1a-M128低頻分布於中國北部一些群體,例如滿族、錫伯族、鄂溫克族和朝鮮族,以及中亞的一些突厥語族群中。另一分支N1b-P43在北部的薩莫耶德人中廣泛分布,也在一些烏拉爾和阿爾泰人群中低頻或中頻分布,N1b大約在6-8年前誕生於西伯利亞[37,38]。頻率最高的下遊單倍群N1c-Tat,可能在1.4萬年前起源於中國西部地區,然後在西伯利亞經曆多次瓶頸效應,最後擴散到東歐和北歐 [36]。這些研究把單倍群N的起源追溯到中國西南或東南亞,單倍群N的人群艱苦跋涉由東南亞穿越大陸一直到北歐,譜寫了壯麗的遷徙史詩。
單倍群N的遷徙史為東亞人群南方起源提供了又一項強有力的證據。然而仍有一些研究在質疑南方起源。Karafet等對來自東亞和中亞地區的25個群體的1300多份樣本進行Y染色體分型研究,他們發現各單倍群間的兩兩差異在東亞南部是非常小的,且東亞南北群體之間並未發現遺傳分化 [29]。薛雅麗等[39]使用貝葉斯全似然法來分析取自中國、蒙古、韓國和日本的27個群體近1000份樣本45個Y染色體SNP和16個STR位點。他們發現東亞北方群體的Y染色體的STR多樣性要高於南方,北方群體的擴散要早於南方群體[39]。但隨後石宏指出Karafet所觀察到的北方群體的高多樣性應是由近期的人群混合造成的,薛雅麗等分析結果也存在這一問題,蒙古、維吾爾和滿族的基因多樣性高應是由他們與西方人群以及漢族大規模混合的結果。另外,薛雅麗等所選取的南方群體代表性不夠,長期地理隔離所造成的群體內部的瓶頸效應或對基因多樣性的估算有較大影響 [31]。
後續的爭論就集中在如何辨析中亞和歐亞西部人群對東亞的基因貢獻。鍾華等[13]對117個群體的近4000份樣本的Y染色體進行高分辨率的分型判斷來試圖闡明這一問題。在鍾華等的研究中,單倍群O-M175、C-M130、D-M174和N-M231仍顯出了南方路線較大基因貢獻。然而,與中亞和歐亞西部相關的單倍群,例如單倍群R-M207和Q-M242,多在東亞西北地區出現,且它們的頻率自西向東有遞減的趨勢。另外,單倍群R-M207和Q-M242的Y染色體STR多樣性也提示了北方路線存在的可能性,也就是1.8萬年前由中亞到北亞的遷徙和3千年前沿絲綢之路的人群混合。
母語還是父語?
人群的遺傳模式常會被其居住習俗和生存方式等社會文化因素所影響。東亞人群的Y染色體可以很好地反映這些文化烙印,例如從父居的群體之間應表現出族群關係與父係的Y染色體較強的關聯性而不是與母係的線粒體。東亞的語言確實與父係的Y染色體[15,22,24,40,41]和整個基因組多樣性[42]有較強的對應關係,但不與母係線粒體相關。例如,Y染色體單倍群O3-M134與漢藏語係人群相關[15,40],O2-M95與南亞語係相關[41]。而且,語言學家們所提出的語係之間的係統發生關係也可反映在Y染色體上但不與全基因組多樣性相關,例如,苗瑤和南亞語係間的近緣性由單倍群O3-M7所反映出來[22],侗傣語係和南島語係間的近緣性由O1-M119所反映[43]。
另一有趣的話題是關於語言擴張和Y染色體的分布模式。現代語言在擴張過程中是否也經曆了一係列的奠基者效應?Atkinson發現音素(元音、輔音和聲調)的多樣性有著出非洲的遞減趨勢,因而推論現代語言也是源出非洲 [44]。但是這一論斷並未得到語言學界的廣泛認可。王傳超等指出Atkinson的結論僅在音素多樣性被簡單分為3-5類之後才成立,而應用沒有簡化的音素原始數值進行分析卻得出了由亞洲中部向外的多樣性遞減趨勢[45],當然這不是關於語言源流的最終結論[46]。音素多樣性的分布模式反映的或許不是現代人的最初起源過程,而是現代人在亞洲中南部的二次擴張。Y染色體的數據也支持亞洲擴張。Y染色體譜係樹的根部在非洲,但僅是單倍群A和B是非洲土著類型,這兩個單倍群或許從未離開非洲。其他單倍群都在CF和DE之下,均源自一個5-7萬年前出非洲的古老突變M168。他們或在3-4萬年前從西亞擴張開來,並衍生出了由C到T的所有單倍群 [3]。因此,在非洲高頻出現的單倍群E很可能來自於亞洲擴張後的回流。在非洲,單倍群A集中出現在科依桑人和撒哈拉人中,單倍群B則主要出現在俾格米人及剛果周圍的其他群體中。非洲的主要群體,也就是班圖人或尼日爾-剛果人,或許都是亞洲回流到非洲的。 單倍群DE-M1(YAP+)經由亞洲返回非洲已被一些研究者提出[47-49],但這推論也遭到了其他人質疑[50,51]。此外,在喀麥隆高頻出現的R1-M173更明確地支持由亞洲向撒哈拉以南非洲的人群回遷[52]。
語言與Y染色體相關但不與線粒體相關,或許反映的是由從父居所引起的性別偏向性遷徙過程。從父居指得是夫妻婚後與丈夫的父母住在一起或住在他們附近。Forster等指出如果父母雙方語言不同,那麽多是父親的語言在家庭中占主導地位 [53]。然而,因為全基因組多樣性也與語係相關,語係形成之時父係和母係應該已完好保存下來。因此,線粒體與語言間的不相關或不能簡單地用從父居來解釋。有可能是因為狩獵或戰爭使得最初群體中女性的有效群體就大於男性,那麽同一語言群體中線粒體受到遺傳漂變得影響就小。當然其他解釋,例如優選男性(下文具體介紹)、男性生育周期長、後代的數目以及突變率的不同等也都有可能。
其他的文化因素,例如農業、軍事和社會地位等,也都有可能影響遺傳模式。文化的傳播模式有兩種:一是人口流動驅動文化傳播,二是單純的文化傳播,不涉及人群的流動[54]。舉例而言,近東到歐洲的農業傳播是否伴隨著大量的新石器農民不斷遷徙一直是爭論的焦點 [55]。Chikhi等應用家係似然法去分析包含22個Y染色體SNP的大批量數據,他們發現近東的農業進入歐洲伴隨著大量的基因流動,這支持了人口流動驅動文化傳播的模式 [56]。另一個例子,文波等研究了28個漢族群體的Y染色體和線粒體的遺傳結構,他們的結果顯示南北方漢族有著相近的Y染色體結構,但是南北漢族在線粒體上卻有著較大差別。或許是由於戰亂或饑荒,大量的北方移民來到南方而改變了中國南方的遺傳結構。他們認為漢族人口擴張和漢文化的南下是符合人口驅動的文化傳播模式的,而且在這次擴張中男性占主體地位。
曆史名人的Y染色體
人群擴張還可以與特殊的社會地位相聯係起來,比如成吉思汗家族。成吉思汗(1162-1227)南征北戰,建立了曆史上疆域最遼闊的國家。他和他的父係親屬因其很高的政治地位而有不計其數的後代,這無疑增高了他們的Y染色體在群體中所占的頻率。結果,可能是成吉思汗或者其近親宗族的Y染色體類型(C3*xC3c,星簇)出現在了從太平洋一直延伸到裏海廣闊地域,占到了全世界男性的0.5% [57]。有趣的是,C3*星簇最高頻地出現在哈薩克斯坦的克烈部 [58]。克烈部高頻的C3*星簇難以歸因於成吉思汗,成吉思汗家族的Y染色體類型或許不是星簇。無論如何,社會選擇確實在C3*星簇的擴張中起到了重要作用。同樣地,Y染色體單倍群C3c-M48被推斷為清朝(1644-1912)滿族皇室的類型,占到了東亞男性的3.3% [59]。
與研究成吉思汗的譜係一樣,Y染色體可以用來追溯曆史名人。人們的姓氏大多繼承自父親,而Y染色體是嚴格的父子相傳的基因組片段。所以姓氏與Y染色體的遺傳應該是平行的,有共同姓氏的男性可能有相同或相近的Y染色體類型。那麽,結合家譜材料,通過研究曆史人物現存後代的Y染色體,可以揭示曆史人物之間的父係關係 [60]。王傳超等用Y染色體分型比對的方法確認了若幹有1800多年曆史、延續70-100代的大跨度家係,這些家係宣稱是魏武帝曹操後裔。曹操後裔的Y染色體類型為O2*-M268,與西漢丞相曹參後裔的Y染色體O3-002611並不一致。所以,曹操一直自稱的源自曹參的貴族血統並不被遺傳學所支持 [61]。
將遺傳學應用到古代史研究將會不斷增多。舉例而言,在家譜學上,同一姓氏的不同家族可以通過遺傳學檢測來填補譜牒材料的缺環 [62]。深度家係對於研究Y染色體的進化也有很大價值,例如薛雅麗等[63]通過測序相隔13代的兩個體的Y染色體得出Y染色體上的堿基突變率為3.0x10-8每突變/每世代。更深度的家係將會是更準確估算突變率的更好的材料。
總結展望
Y染色體在解析東亞現代人源流史中起到了重要作用。盡管有許多問題仍有待探索,但史前遷徙過程的基本框架已經明晰了。占到東亞男性90%以上的C、D、N和O四個單倍群很可能起源於東南亞,隨澳大利亞人、尼格利陀人和蒙古利亞人這三種不同體質特征的現代人經曆了三次大的遷徙浪潮。歐亞中西部特征Y染色體單倍群E、G、H、I、J、L、Q、R和T在中國西北的分布模式反映出了來自西方的近期基因交流和可能的北部路線的影響,這些單倍群自西向東的遞減趨勢也可以清晰地觀察到。
然而,現階段東亞的Y染色體研究遇到了兩個瓶頸。一是東亞特異單倍群O-M175的解析度太低。雖然,單倍群O人口眾多,但O下的位點卻比R和E都少。例如,002611、M134和M117這三個位點代表了東亞近2.6億人,但沒有更下遊的位點可以用來更精細解析這些群體的遺傳結構。另一個瓶頸是支係和群體分化時間的估算。現在絕大部分的時間估算用的是Y染色體的STR位點,盡管這在理論上說得通,但對於最恰當的STR估算時間的方式還一直有爭議。尤其值得提出的是這裏有兩種經常用到的Y染色體STR突變率,即進化突變率 [20,21]和家係突變率[64]。如何選用這兩種突變率爭議很大,因兩者估算出的時間甚至可相差3倍。而且STR位點的相似性及多變性也使得時間估算的準確度大打折扣。因此,上文提到一些時間點也僅僅是作為某些單倍群或人群分化的粗略參考。
二代測序技術的不斷發展使得全測序大樣本量和深度家係的Y染色體成為可能。例如,千人基因組計劃在其低覆蓋項目中已經以1.83的平均深度測序了77個男性的Y染色體,15.23的深度測序了兩個連續三代的男性家係 [65]。更進一步的深度測序將既可以細化Y染色體譜係樹又可以為進化研究提供較精確的生物鍾校準。
致謝
本項目得到了國家自然科學基金(31071098, 91131002),國家優秀青年科學基金(31222030),上海市啟明星計劃(12QA1400300),教育部重點項目(311016),上海市教委科技創新重點項目(11zz04),上海市人才發展資金(2010001) ,複旦大學文科科研推進計劃的資助,特此致謝!
參考文獻
1. Cavalli-Sforza LL: (1998) The Chinese human genome diversity project. Proc. Natl Acad. Sci. USA, 95: 11501–11503.
2. Jobling M A, Tyler-Smith C. (1995 ) Father and sons: the Y chromosome and human evolution. Trends Genet, 11: 449–456.
3. Underhill P A, Shen P, Lin A A, et al. (2000) Y chromosome sequence variation and the history of human populations. Nat. Genet, 26: 358–361.
4. Su, B. Xiao J, Underhill P, et al. (1999 ) Y-chromosome evidence for a northward migration of modern human into East Asia during the last ice age. Am J Hum Genet, 65: 1718–1724.
5. Ke Y, Su B, Song X, et al. (2001) African origin of modern humans in East Asia: a tale of 12,000 Y chromosomes. Science, 292:1151-1153.
6. Green R E, Krause J, Briggs A W, et al. (2010) A draft sequence of the Neandertal genome. Science, 328:710-722.
7. Reich D, Green R E, Kircher M, et al. (2010) Genetic history of an archaic hominin group from Denisova Cave in Siberia. Nature 2010, 468:1053-1060.
8. Wang C C, Farina S E, Li H: (2012) Neanderthal DNA and Modern Human Origins. Quatern Int, doi:10.1016/j.quaint..02.027.
9. Shi Y F, Cui Z J, Li J J. (1989) Quaternary glacier in eastern China and the climate fluctuation. Beijing, Science Press.
10. Jobling M A, Hurles M, Tyler—Smith C. (2004) Human Evolutionary Genetics (Origins, Peoples and Disease). New York: Garland Science.
11. Clark P U, Dyke A S, Shakun J D, et al. (2009) The Last Glacial Maximum. Science, 325:710-714.
12. Zhong H, Shi H, Qi X B, et al. (2011) Extended Y chromosome investigation suggests postglacial migrations of modern humans into East Asia via the northern route. Mol Biol Evol, 28(1):717-727.
13. Piazza A: (1998) Towards a genetic history of China. Nature, 395: 636–639.
14. Yan S, Wang C C, Li H, et al. Genographic Consortium: (2011) An updated tree of Y-chromosome Haplogroup O and revised phylogenetic positions of mutations P164 and PK4. Eur J Hum Genet, 19(9):1013-1015.
15. Shi H, Dong Y L, Wen B, et al. (2005) Y-chromosome evidence of southern origin of the East Asian-specific haplogroup O3-M122. Am J Hum Genet 2005, 77(3):408-419.
16. Kayser M, Choi Y, van Oven M, et al. (2008) The impact of the Austronesian expansion: evidence from mtDNA and Y chromosome diversity in the Admiralty Islands of Melanesia. Mol Biol Evol 2008, 25(7):1362-1374.
17. Su B, Jin L, Underhill P, et al. (2000) Polynesian origins: insights from the Y chromosome. Proc Natl Acad Sci USA, 97(15):8225-8228.
18. Ding Q L, Wang C C, Farina S E, et al. (2011) Mapping Human Genetic Diversity on the Japanese Archipelago. Advances in Anthropology, 1(2): 19-25.
19. Hammer M F, Karafet T M, Park H, et al. (2006) Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes. J Hum Genet, 51:47–58.
20. Zhivotovsky LA. (2001) Estimating divergence time with the use of microsatellite genetic distances: impacts of population growth and gene flow. Mol Biol Evol, 18:700–709.
21. Zhivotovsky L A, Underhill P A, Cinniog? lu C, et al. (2004) The effective mutation rate at Y chromosome short tandem repeats, with application to human population-divergence time. Am J Hum Genet , 74:50–61
22. Cai X, Qin Z, Wen B, et al. (2011) Genographic Consortium: Human migration through bottlenecks from Southeast Asia into East Asia during Last Glacial Maximum revealed by Y chromosomes. PLoS One, 6(8):e24282.
23. Wang C C, Yan S, Qin Z D, et al. (2012) Late Neolithic expansion of ancient Chinese revealed by Y chromosome haplogroup O3a1c-002611. J Syst Evol, DOI: 10.1111/j.1759-6831.2012.00244.x
24. Zhong H, Shi H, Qi XB, et al. (2010) Global distribution of Y-chromosome haplogroup C reveals the prehistoric migration routes of African exodus and early settlement in East Asia. J Hum Genet, 55(7):428-435.
25. Kayser M, Brauer S, Cordaux R, et al. (2006) Melanesian and Asian origins of Polynesians: mtDNA and Y chromosome gradients across the Pacific. Mol Biol Evol 2006, 23: 2234–2244.
26. Sengupta S, Zhivotovsky L A, King R, et al. (2006) Polarity and temporality of high-resolution y-chromosome distributions in India identify both indigenous and exogenous expansions and reveal minor genetic influence of Central Asian pastoralists. Am J Hum Genet. 2006, 78: 202–221.
27. Gayden T, Cadenas A M, Regueiro M, et al. (2007) The Himalayas as a directional barrier to gene flow. Am J Hum Genet, 80: 884–894.
28. Karafet T M, Mendez F L, Meilerman M B, et al. (2008) New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree. Genome Res, 18:830–838.
29. Karafet T M, Xu L, Du R, et al. (2001) Paternal population history of East Asia: sources, patterns, and microevolutionary processes. Am J Hum Genet, 69(3):615-628.
30. Thangaraj K, Singh L, Reddy AG, Rao VR, Sehgal SC, Underhill PA, Pierson M, Frame IG, Hagelberg E: (2003) Genetic affinities of the Andaman Islanders, a vanishing human population. Curr Biol, 13(2):86-93.
31. Shi H, Zhong H, Peng Y, et al. (2008) Y chromosome evidence of earliest modern human settlement in East Asia and multiple origins of Tibetan and Japanese populations. BMC Biol, 6:45.
32. Wen B, Xie X, Gao S, et al. (2004) Analyses of genetic structure of Tibeto-Burman populations reveals sex-biased admixture in southern Tibeto-Burmans. Am J Hum Genet, 74(5):856-865.
33. Chandrasekar A, Saheb S Y, Gangopadyaya P, et al. (2007) YAP insertion signature in South Asia. Ann Hum Biol, 34:582-586.
34. Delfin F, Salvador J M, Calacal G C, et al. (2011) The Y-chromosome landscape of the Philippines: extensive heterogeneity and varying genetic affinities of Negrito and non-Negrito groups. Eur J Hum Genet, 19:224-230.
35. Scholes C, Siddle K, Ducourneau A, et al. (2011) Genetic diversity and evidence for population admixture in Batak Negritos from Palawan. Am J Phys Anthropol, 146:62-72.
36. Rootsi S, Zhivotovsky L A, Baldovic M, et al. (2007) A counter-clockwise northern route of the Y-chromosome haplogroup N from Southeast Asia towards Europe. Eur J Hum Genet, 15:204-211.
37. Derenko M, Malyarchuk B, Denisova G, et al. (2007) Y-chromosome haplogroup N dispersals from south Siberia to Europe. J Hum Genet, 52(9):763-770.
38. Mirabal S, Regueiro M, Cadenas A M, et al. (2009) Y-chromosome distribution within the geo-linguistic landscape of northwestern Russia. Eur J Hum Genet, 17(10):1260-1273.
39. Xue Y, Zerjal T, Bao W, et al. (2006) Male demography in East Asia: a north-south contrast in human population expansion times. Genetics, 172(4):2431-2439.
40. Wen B, Li H, Lu D, et al. (2004) Genetic evidence supports demic diffusion of Han culture. Nature, 431:302-5.
41. Kumar V, Reddy A N, Babu J P, et al. (2007)Y-chromosome evidence suggests a common paternal heritage of Austro-Asiatic populations. BMC Evol Biol, 7:47.
42. The HUGO Pan-Asian SNP Consortium.(2009) Mapping human genetic diversity in Asia. Science, 326: 1541.
43. Li H, Wen B, Chen S J, et al. (2008) Paternal genetic affinity between Western Austronesians and Daic populations. BMC Evol Biol, 8:146.
44. Atkinson Q D: (2011) Phonemic diversity supports a serial founder effect model of language expansion from Africa. Science, 332:346-349.
45. Wang C C, Ding Q L, Tao H, et al. (2012) Comment on "Phonemic diversity supports a serial founder effect model of language expansion from Africa". Science, 335:657.
46. Atkinson Q D. (2012) Response to Comment on “Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa”. Science, 335:657.
47. Hammer M F, Spurdle A B, Karafet T, et al. (1997) The geographic distribution of human Y chromosome variation. Genetics, 145:787–805.
48. Hammer M F, Karafet T, Rasanayagam A, et al. (1998) Out of Africa and back again: nested cladistic analysis of human Y chromosome variation. Mol Biol Evol, 15: 427–441.
49. Hammer M F, Karafet T M, Redd A J, et al. (2001) Hierarchical patterns of global human Y-chromosome diversity. Mol Biol Evol, 18:1189–1203.
50. Underhill P A, Passarino G, Lin A A, et al. (2001) The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations. Ann Hum Genet, 65:43–62.
51. Underhill P A, Roseman C C. (2001) The case for an African rather than an Asian origin of the human Y-chromosome YAP insertion. In: Jin L, Seielstad M, Xiao C (eds) Recent advances in human biology, vol. 8: genetic, linguistic and archaeological perspectives on human diversity in Southeast Asia. World Scientific Publishing, New Jersey, pp 43–56.
52. Cruciani F, Santolamazza P, Shen P D, et al. (2002) A Back Migration from Asia to Sub-Saharan Africa Is Supported by High-Resolution Analysis of Human Y-Chromosome Haplotypes. Am. J. Hum. Genet 70:1197–1214.
53. Forster P, Colin R. (2011) Mother Tongue and Y Chromosomes. Science, 333:1390-1391.
54. Cavalli-Sforza L L, Menozzi P, Piazza A. (1994) The History and Geography of Human Genes. Princeton: Princeton Univ. Press.
55. Sokal R, Oden N L, Wilson C. (1991) Genetic evidence for the spread of agriculture in Europe by demic diffusion. Nature, 351: 143–145.
56. Chikhi L, Nichols RA, Barbujani G, et al. (2002) Y genetic data support the Neolithic demic diffusion model. Proc Natl Acad Sci USA, 99:11008–11013.
57. Zerjal T, Xue Y, Bertorelle G, et al. (2003) The genetic legacy of the Mongols. Am J Hum Genet, 72: 717–721.
58. Abilev S, Malyarchuk B, Derenko M, et al. (2012) The Y-chromosome C3* star-cluster attributed to Genghis Khan's descendants is present at high frequency in the Kerey clan from Kazakhstan. Hum Biol, 84(1):79-89.
59. Xue Y, Zerjal T, Bao W, et al. (2010) Recent spread of a Y-chromosomal lineage in northern China and Mongolia. Am J Hum Genet 2005, 77:1112–1116.
60. Wang C C, Yan S, Li H:(2010) Surnames and the Y Chromosomes. Commun Contemp Anthropol, 4:e5/27-34.
61. Wang C, Yan S, Hou Z, et al. (2012) Present Y chromosomes reveal the ancestry of Emperor CAO Cao of 1800 years ago. J Hum Genet, 57(3):216-8.
62. Sykes B, Irven C: (2000)Surname and the Y-chromosome. Am J Hum Genet, 66: 1417-1419.
63. Xue Y, Wang Q, Long Q, et al. (2009) Human Y chromosome base-substitution mutation rate measured by direct sequencing in a deep-rooting pedigree. Curr Biol, 19(17):1453-7.
64. Gusmão L, Sánchez-Diz P, Calafell F, et al. (2005) Mutation rates at Y chromosome specific microsatellites. Hum Mutat, 26:520-528.
65. 1000 Genomes Project Consortium: (2010) A map of human genome variation from population-scale sequencing. Nature, 467:1061-73.
http://blog.sciencenet.cn/blog-348453-699717.html 此文來自科學網王傳超博客,轉載請注明出處。