抽象的
猶太人血統問題已爭論了兩個多世紀,至今仍未得到解決。“萊茵蘭假說”將東歐猶太人描繪成一個“孤立的群體”,源自一小群向東遷移並迅速擴張的德國猶太人。而“可薩假說”則認為東歐猶太人的後裔是可薩人,可薩人是突厥部族的混合體,他們在公元初定居高加索地區,並於8世紀皈依猶太教。美索不達米亞和希臘羅馬的猶太人不斷鞏固著猶太化的帝國,直到13世紀。帝國崩潰後,猶太-可薩人逃往東歐。因此,歐洲猶太人的崛起可以用猶太-可薩人的貢獻來解釋。然而,迄今為止,由於缺乏高加索人群的全基因組數據,可薩人的貢獻僅基於經驗估計。近期對現代高加索人群的測序促使我們重新審視可薩假說,並將其與萊茵蘭假說進行比較。我們應用了廣泛的群體遺傳學分析來比較這兩個假說。我們的研究結果支持可薩假說,並將歐洲猶太人的基因組描繪成近東-高加索、歐洲和閃米特血統的混合體,從而鞏固了先前關於猶太人血統的相互矛盾的報道。我們進一步描述了高加索人群之間的一個重大差異,這一差異可以用猶太人早期在南高加索和中高加索地區的存在來解釋。我們的研究結果對於塑造高加索地區遺傳多樣性的人口因素以及醫學研究具有重要意義。
介紹
當代東歐猶太人是現代猶太社區中最大的民族宗教群體,約占全球 1300 多萬猶太人的 90%(Ostrer 2001)。據推測,東歐猶太人來自中歐的一個小創始群體,並被認為保持了高度的族內通婚,因此被認為是“群體孤立”和疾病研究中寶貴的受試者(Carmeli 2004),盡管他們的祖先在遺傳學家、曆史學家和語言學家之間仍然存在爭議(Wexler 1993;Brook 2006;Sand 2009;Behar et al. 2010)。最近,一些大規模研究試圖通過對歐亞猶太人和非猶太人群進行基因分型來繪製猶太人群的遺傳多樣性(Conrad et al. 2006;Kopelman et al. 2009;Behar et al. 2010)。有趣的是,其中一些研究將高加索人群與東歐猶太人聯係起來,這與中歐創始群體的敘述相矛盾。由於校正人口結構和使用合適的對照在醫學研究中至關重要,因此檢驗那些旨在解釋東歐和中歐猶太人血統的假設至關重要。任何假設麵臨的主要挑戰之一是解釋猶太人在東歐的大規模存在,據估計,20世紀初東歐猶太人的數量約為800萬。我們通過應用多種分析方法——包括三群體檢驗、主成分分析、生物地理起源分析、混合分析、血統同一性分析 (IBD)、等位基因共享距離分析和單親分析——來研究歐洲猶太人的基因結構,並根據兩種主流假設檢驗其準確性。這兩種假設要麽描繪了單一中東血統,要麽描繪了中東-高加索-歐洲混合血統,以解釋東歐猶太人的血統。
“萊茵蘭假說”認為,現代歐洲猶太人是猶大的後裔——猶大人是閃米特人起源的以色列-迦南部落(圖 1和2)(補充說明S1,補充材料在線)。它提出了兩次大規模的移民浪潮:第一次發生在穆斯林征服巴勒斯坦(公元 638 年)後的 200 年間,由離開穆斯林巴勒斯坦前往歐洲的虔誠的猶太人組成( Dinur 1961)。這些移民是否加入了現有的猶太化的希臘羅馬社區尚不清楚,他們對南歐基因庫的貢獻程度也不清楚。第二次移民浪潮發生在 15 世紀初,一群 50,000 名德國猶太人向東遷移,並帶來了長達半個世紀的嬰兒潮時代( Atzmon 等人 2010)。萊茵蘭假說預測歐洲猶太人具有中東血統,並且歐洲猶太人之間存在高度基因相似性( Ostrer 2001; Atzmon 等人 2010; Behar 等人 2010)。
與之競爭的“可薩人假說”認為東歐猶太人是可薩人的後裔(補充說明S1,補充材料在線)。可薩人是由斯拉夫人、斯基泰人、匈奴-保加利亞人、伊朗人、阿蘭人和土耳其部落組成的聯盟,他們在中北高加索地區建立了鐵器時代晚期最強大的帝國之一,並於公元 8 世紀皈依猶太教(圖 1和2)( Polak 1951; Brook 2006; Sand 2009)。由這些部落融合而形成的可薩人、亞美尼亞人和格魯吉亞人群體( Polak 1951)隨後經曆了相對隔離、分化和原地遺傳漂變( Balanovsky 等人 2011)。聖經和考古記錄暗示公元前晚期幾個世紀原始猶太人和亞美尼亞人之間活躍的貿易關係( Polak 1951; Finkelstein 和 Silberman 2002),這可能導致了這兩個人群之間的小規模混合,以及猶太人在高加索地區的存在。皈依猶太教後,猶太-可薩人的人口結構因猶太人從拜占庭帝國和哈裏發國多次遷徙到可薩帝國而進一步改變(圖 1)。帝國崩潰和黑死病(1347-1348 年)爆發後,猶太-可薩人向西逃亡( Baron 1993),定居在正在崛起的波蘭王國和匈牙利( Polak 1951),並最終擴散到中歐和西歐。可薩人假說認為歐洲猶太人的血統來自高加索、歐洲和中東。此外,歐洲猶太社群在血統和基因異質性方麵預計會存在差異。可薩假說也為高加索群體的基因多樣性提供了兩種解釋:一是6至10世紀期間多次湧入可薩的移民潮;二是留在高加索地區的猶太-可薩人。
試圖推斷歐洲猶太人血統的遺傳學研究得到了不一致的結果。一些研究指出歐洲猶太人與阿迪格人等高加索人群之間存在遺傳相似性(Behar 等人,2003 年;Levy-Coffman,2005 年;Kopelman 等人,2009 年),而一些研究則指出與巴勒斯坦人等中東人群的相似性(Hammer 等人,2000 年;Nebel 等人,2000 年),還有人指出與意大利人等南歐人群的相似性(Atzmon 等人,2010 年;Zoossmann-Diskin,2010 年)。這些研究大多是在前基因組時代使用單親標記並包括不同的參考人群進行的,這使得它們的結果難以比較。最近采用全基因組數據的研究報告顯示,歐洲猶太人與德魯茲人、意大利人和中東人群具有高度的遺傳相似性(Atzmon 等人,2010 年;Behar 等人,2010 年)。
盡管萊茵蘭假說和可薩假說都描述了猶太人的血統,而且它們並不互相排斥,但它們還是有明顯的區別,因為高加索人和閃米特人被認為是種族和語言上截然不同的(Patai 和 Patai 1975;Wexler 1993;Balanovsky 等人 2011)。根據這兩種假說,猶太人都是接受猶太教、移居到其他地方並維持其宗教信仰直至今日的部落,因此,預計他們會與鄰近人群表現出某些差異。因為這兩種假說都認為東歐猶太人大約在同一時間(13 世紀和 15 世紀)抵達東歐,所以我們假設他們與鄰近人群經曆了相似的低而固定的混合率,估計在過去 50 代中每代為 0.5%(Ostrer 2001)。這些相對較近的混合很可能重塑了所有歐洲猶太人的人口結構,並增加了他們與高加索或中東人群的遺傳距離。因此,我們並不期望與可薩人和猶太人群實現完美的匹配,而是評估他們的親緣關係。
材料和方法
數據收集
完整數據集包含來自8個猶太群體和74個非猶太群體的1,287名無血緣關係個體,涉及超過531,315個常染色體單核苷酸多態性(SNP)。使用PLINK中的indep-pairwise算法,在200個SNP的窗口中(每次滑動窗口25個SNP),移除強LD( r2 > 0.4)中任意一對SNP中的一個,創建連鎖不平衡(LD )剪枝數據集(Purcell等人,2007)。最終共計獲得221,558個常染色體SNP,除使用完整數據集的血統相同(IBD)分析外,所有常染色體分析均選擇這些SNP。這兩個數據集均來自http://www.evolutsioon.ut.ee/MAIT/jew_data/(上次訪問時間為 2012 年 12 月 19 日)(Behar 等人,2010 年)。線粒體 DNA (mtDNA) 和 Y 染色體數據來自Behar 等人(2010 年)先前發表的數據集。這些標記的選擇與先前報告的數據集所達到的係統發育分辨率水平相匹配,並代表了一組多樣化的標記。共收集了 27 個人群的 11,392 個樣本,用於 mtDNA(6,089 個)和 Y 染色體(5,303 個)分析(補充表 S1和補充數據,補充材料在線)。
術語
在日常用語中,東歐和中歐猶太人實際上與阿什肯納茲猶太人同義,並被視為一個整體(Tian 等人,2008 年;Atzmon 等人,2010 年;Behar 等人,2010 年)。然而,該術語具有誤導性,因為希伯來語“Ashkenaz”在中世紀拉比文獻中用於指德國——這促成了現代東歐猶太人起源於萊茵河的說法。因此,我們避免使用“阿什肯納茲猶太人”一詞。猶太人大致細分為東歐(白俄羅斯、拉脫維亞、波蘭和羅馬尼亞)和中歐(德國、荷蘭和奧地利)猶太人。與認為“阿什肯納茲猶太人”不同於“塞法迪猶太人”的文獻一致,我們排除了後者。完整的人口符號描述在補充表S3,在線補充材料。
替代人群的選擇
由於古代猶太人和可薩人已被滅亡,他們的遺骸尚未測序,根據先前的研究(Levy-Coffman 2005;Kopelman 等人 2009;Atzmon 等人 2010;Behar 等人 2010),當代中東和高加索人群被用作替代人群。巴勒斯坦人被認為是原始猶太人,因為他們被認為與猶太人有著相似的語言、種族和地理背景,並與歐洲猶太人有著共同的祖先(Bonné-Tamir 和 Adam 1992;Nebel 等人 2000;Atzmon 等人 2010;Behar 等人 2010)。同樣地,高加索格魯吉亞人和亞美尼亞人被認為是原始可薩人,因為人們認為他們與可薩人來自同一基因群體(Polak 1951;Dvornik 1962;Brook 2006)。
三群體檢驗
f3統計數據使用等位基因頻率差異來評估群體X與另外兩個群體A和B 的混合情況,因此f 3( X ; A , B ) ( Reich 等人,2009 年)。如果X是A和B的混合,而不是遺傳漂變的結果,則 f 3 將為負數。顯著的負f 3 表示X群的祖先在與A和B分化之後經曆了混合的曆史。f3統計數據是使用TreeMix的threepop程序( Pickrell 和 Pritchard,2012 年)計算得出的,其中k = 500,針對 221,558 個 SNP 集。該測試不同於ADMIXTURE ( Alexander 等人,2009 年),後者報告與最可能的祖先的混合比例。
主成分分析
雖然常用的“多群體”主成分分析 (PCA) 具有許多吸引人的特性,但應謹慎使用,以避免由於群體選擇和樣本量變化而產生的偏差(Price 等人,2006 年;McVean,2009 年)。為了避免這些偏差,我們開發了一個簡單的“雙群體”框架,由三個樣本量大且混合程度最低的“外群”群體——姆布提和比亞卡俾格米人(南非)、法國巴斯克人(歐洲)和漢族中國人(東亞)——和兩個感興趣的群體組成,所有群體的樣本量均相等。該框架的基礎是將顯著 PC 的數量最小化為四個或更少(Tracy-Widom 檢驗,P < 0.01),並將前兩個 PC 的解釋方差部分最大化到 20% 以上。 PCA 計算使用EIGENSOFT軟件包 ( Patterson 等人,2006 )中的 smartpca 進行。凸包使用 Matlab 的“convhull”函數計算,並圍繞聚類質心繪製。兩個目標種群之間的關聯性通過其聚類的等量重疊來評估。小種群(<7 個樣本)被排除在分析之外。
估計人口的生物地理起源
Novembre 等人(2008)提出了一種基於 PCA 的方法,可精確到歐洲幾百公裏範圍內,以確定種群當前的生物地理起源。雖然這種方法沒有隱含的曆史模型,但它將遺傳多樣性與地理環境關聯起來,因此可以成為研究生物地理學的有用工具。為了減少由大小不均的多個種群造成的偏差(Patterson 等人,2006;McVean,2009),我們采用了雙種群框架,該框架包含三個外群和兩個目標種群:一個在相關時間段內地理來源已知的種群,與所討論的種群(如亞美尼亞人)和所討論的種群(如東歐猶太人)聚集在一起。前四個種群被用作所討論種群的訓練集。PCA 計算按先前描述的方式進行。PC1-PC2 坐標的旋轉角度按Novembre 等人(2008)的方法計算。簡而言之,在每幅圖中,旋轉主成分分析 (PC) 軸,以找到使訓練樣本的 PC1 和 PC2 中值與其所在國家經緯度相關性之和最大化的角度。經緯度數據來自文獻或該國的近似質心。測地線距離以公裏為單位,使用 Matlab 函數“distance”計算。
混合物分析
在監督學習模式下,我們采用了類似結構的方法,就像 ADMIXTURE(Alexander 等人,2009)中實現的那樣。ADMIXTURE根據指定祖先群體的等位基因頻率來估計個體的祖先。我們使用ADMIXTURE的引導程序和默認參數來計算標準誤差。我們在所有分析中都觀察到了較低的標準誤差(<0.05)。除南歐人外,其餘人群均按其平均非洲和亞洲血統排序。在本分析中,三名荷蘭猶太人與東歐猶太人歸為一類。
IBD分析
為了檢測 IBD 片段,我們使用不同的隨機種子運行了10 次fastIBD,並按照Browning 和 Browning (2011)的方法合並結果。僅當合並分析的fastIBD分數小於 e –10時,片段才被視為 IBD 。這個低閾值對應於可能是 IBD 的長共享單倍型 (≥1 cM)。長域之間的短間隙 (<50 個索引) 被認為是假陰性和串聯的 ( Browning 和 Browning 2011 )。通過找到每個歐洲猶太人和特定人群中所有其他個體之間最大的總 IBD 共享,獲得了歐洲猶太人和不同人群之間的成對 IBD 片段。
等位基因共享距離

單親分析

結果
為了證實萊茵蘭假說和可薩假說確實描繪了不同的血統,我們評估了高加索人群與閃米特人群之間的背景混合程度。我們計算了巴勒斯坦人與六個高加索和歐亞人群之間的f3統計數據,並以非洲桑人作為外群,例如f3(巴勒斯坦人、桑人、亞美尼亞人)。土耳其人(-0.0013)、亞美尼亞人和格魯吉亞人(-0.0019)、列茲金人和阿迪蓋人(-0.0015)以及俄羅斯人(-0.0011)的f3結果顯示,巴勒斯坦人與受試人群之間存在輕微但顯著的混合(-26 < Z- score < -13)。由於亞美尼亞人和格魯吉亞人在600代前就與土耳其人分道揚鑣(Schonberg等人,2011),我們可以假設,他們大部分的混合血統源自該血統,且符合該地區典型的背景混合預期水平,而非近期與閃米特人群的混合。因此,歐洲猶太人和高加索人群之間的相似性不太可能源於共同的閃米特血統。
接下來,我們使用主成分分析 (PCA) 來識別能夠捕捉數據中大部分信息的獨立維度。PCA 采用了兩種框架:一種是適用於所有人群的“多人群”框架(圖 3),另一種是分別適用於歐亞人群以及俾格米人和漢族人群的框架(補充圖S2,在線補充材料)和我們新穎的“雙群體”框架(補充圖S3,在線補充材料)。在所有分析中,所研究的樣本都沿著全球遺傳變異的兩個公認的地理軸線排列:PC1(撒哈拉以南非洲與舊世界其他地區)和PC2(歐亞大陸東部與西部)( Li等人,2008年)。我們的研究結果揭示了地理上精細的群體,例如從西歐延伸到東歐的近乎對稱的連續歐洲邊緣、平行的高加索邊緣和近東人群(補充圖S1,補充材料在線)按土耳其-伊朗和德魯茲人聚類(圖3)組織。中東人口沿著貝都因人和近東人口之間的對角線形成梯度,這與他們的地理分布相似。其餘埃及人和大部分沙特人的分布與中東人口分開。
根據萊茵蘭假說或可薩假說,歐洲猶太人預計將與中東或高加索地區的原住民聚集在一起。所有PC分析的結果(圖3,補充圖S2和補充數據,在線補充材料)顯示,超過 70% 的歐洲猶太人和幾乎所有東歐猶太人都與格魯吉亞、亞美尼亞和阿塞拜疆猶太人聚集在高加索地區(圖 3和補充圖S3,補充材料在線)。約 15% 的中歐猶太人與德魯茲人聚居,其餘的與塞浦路斯人聚居。所有歐洲猶太人的聚居地與中東聚居地截然不同。可薩假說的有力證據是歐洲猶太人與居住在古代可薩兩端的人群聚居:亞美尼亞人、格魯吉亞人和阿塞拜疆猶太人(圖 1)。由於高加索人群在高加索地區相對孤立,且沒有在可薩淪陷前高加索人群大規模遷徙到東歐和中歐的記錄( Balanovsky 等人,2011),這些發現意味著歐洲猶太人和高加索人群有著共同的起源。
為了評估我們基於主成分分析方法識別人群生物地理起源的能力,我們首先嚐試識別德魯茲人的生物地理起源。德魯茲宗教起源於11世紀,但其民族起源至今仍是諸多困惑和爭論的根源(Hitti 1928)。我們將德魯茲人的生物地理起源追溯到以下地理坐標:北緯38.6±3.45°,東經36.25±1.41°(補充圖S4,補充材料在線)在近東(補充圖S1,補充材料在線)。一半德魯茲人緊密聚集在土耳其東南部,其餘則散居在敘利亞北部和伊拉克一帶。這些結果與Shlush等人(2008)利用線粒體DNA分析的結果一致。推斷出的德魯茲人地理位置被用於後續分析。
歐洲猶太人的地理起源因參考人群不同而有所差異(圖 4和補充圖S5,補充材料在線),但所有結果都集中在現代土耳其、亞美尼亞、格魯吉亞和阿塞拜疆沿岸的南可薩利亞。在所有分析中,與中歐猶太人相比,東歐猶太人聚集得更緊密。東歐猶太人(北緯 38 ± 2.7°,東經 39.9 ± 0.4°)和中歐猶太人(北緯 35 ± 5°,東經 39.7 ± 1.1°)的地理坐標中,亞美尼亞人的偏差最小(圖 4)。格魯吉亞人也得到了類似的結果(補充圖S5,補充材料在線)。值得注意的是,東歐猶太人的平均坐標距離可薩利亞南部邊界(北緯 42.77°,東經 42.56°)560 公裏,靠近薩曼達爾——公元 720 年至 750 年可薩利亞的首都(波拉克 1951 年)。
種群間基因流動的持續時間、方向和速率決定了混合比例和因血統而相同的染色體片段的總長度。混合計算是使用監督學習方法在結構化分析中進行的。與無監督方法相比,這種方法有許多優勢,無監督方法不僅在假設K 個抽象未混合種群獨立進化的情況下將祖先追溯到它們(Chakravarti 2009;Weiss 和 Long 2009),而且在用於研究猶太人血統時也存在問題,因為猶太人血統隻能追溯到 3,000 年前(圖 2 )。此外,無監督方法的結果會根據用於分析的特定種群和K的選擇而有所不同,導致研究結果之間無法比較。混合是用一組代表遺傳上截然不同的地區的七個人群的參考集來計算的:俾格米人(南非)、巴勒斯坦人(中東)、亞美尼亞人(高加索)、土耳其-伊朗人(近東)、法國巴斯克人(西歐)、楚瓦什人(東歐)和漢族人(東亞)(圖 5)。祖先成分根據地理區域將所有人群分組,歐洲猶太人與高加索人群聚集在一起。正如所料,東歐和西歐血統在歐洲人群中表現出相反的梯度。近東-高加索血統在中歐(38%)和東歐(32%)猶太人中占主導地位,其次是西歐血統(30%)。在非高加索人群中,高加索血統在歐洲猶太人(26%)和塞浦路斯人(31%)中是最大的。這些人群在非中東人群中也表現出最大比例的中東血統。由於東歐人群中既沒有高加索血統,也沒有中東血統,我們的研究結果表明,東歐猶太人在抵達東歐之前就獲得了這些血統。盡管萊茵蘭假說認為猶太人在7世紀從巴勒斯坦遷徙到歐洲,從而解釋了中東血統,但它無法解釋龐大的高加索血統,因為高加索血統幾乎是高加索人群特有的。
盡管東歐和中歐猶太人與高加索人群聚居(圖5),但他們擁有很大一部分西歐和中東血統,而高加索人群中則沒有這兩種血統。根據可薩人假說,西歐血統是由希臘羅馬猶太人傳入可薩的,而中東血統則暗示了早期以色列原始猶太人和美索不達米亞猶太人的貢獻(Polak 1951;Koestler 1976;Sand 2009)。中歐和東歐猶太人的主要區別在於他們的中東血統(分別為30%和25%)和東歐血統(分別為3%和12%),這可能是由於後期混合造成的。
德魯茲人表現出大量的土耳其-伊朗血統(83%),這與他們的近東起源相符(補充圖S4,在線補充材料)。德魯茲人和塞浦路斯人在中東和西歐血統方麵與歐洲猶太人相似,盡管他們在高加索血統的比例上差異很大。這些結果可以解釋在排除高加索人群的研究中報告的歐洲猶太人、南歐人和德魯茲人之間的遺傳相似性( Price 等人 2008 年; Atzmon 等人 2010 年; Zoossmann-Diskin 2010 年)。總的來說,我們的結果將歐洲猶太人基因組描繪成近東-高加索、西歐、中東和東歐血統的鑲嵌體,比例依次遞減。
為了進一步了解造成歐洲猶太人和潛在人群之間遺傳相似性的基因組區域細節,我們比較了他們之間由 IBD 共享的總基因組區域。如果歐洲猶太人起源於高加索人群,那麽兩者共享的 IBD 區域將比中東人群更長。IBD 分析呈現偏態雙峰分布,體現出主要高加索血統和次要中東血統(圖 6),與混合結果一致(圖 5)。歐洲猶太人和高加索人群之間共享的總 IBD 區域(平均 9.5 cM)明顯大於與巴勒斯坦人共享的區域(5.5 cM)(Kolmogorov-Smirnov 擬合優度檢驗,P < 0.001)。據我們所知,這是迄今為止報告的歐洲猶太人和非猶太人群之間最大的 IBD 區域。歐洲猶太人與其他人群之間 IBD 總數的減少,加上與高加索地區距離的增加,支持了可薩人假說。
接下來,我們估計了歐亞猶太社區的族內通婚水平,並將他們的遺傳距離與非猶太鄰居、高加索和中東人群進行了比較。我們的結果擴展了先前關於猶太人群族內通婚程度較高的報告(Behar 等人,2010 年),並將族內通婚的範圍縮小到區域性猶太社區(表 1,左圖)。猶太人與其自身社區成員的相似性顯著高於與其他猶太群體的相似性(P < 0.01,引導t檢驗),保加利亞、土耳其和格魯吉亞猶太人是個明顯的例外。這些結果強調了歐亞大陸各地猶太社區之間,甚至社區內部的高度異質性,例如巴爾幹和高加索猶太人的情況。
區域猶太社區與大陸猶太社區之間的遺傳距離 (ASD)(左圖)以及區域猶太社區與其非猶太鄰近人群、高加索和中東人群之間的遺傳距離 (ASD)(右圖)
地區猶太社區 | 猶太人口 | 非猶太人口 | ||||||
---|---|---|---|---|---|---|---|---|
自己 | 歐洲的 | 亞洲 | 非洲 | 鄰近人口 | 高加索 | 中東 | ||
東歐 | 0.2318 | 0.2328 | 0.2381 | 0.2446 | 匈牙利 | 0.2346 | 0.2340 | 0.2387 |
中歐 | 0.2312 | 0.2326 | 0.2378 | 0.2445 | 意大利人 | 0.2335 | 0.2338 | 0.2385 |
保加利亞語 | 0.2326 | 0.2331 | 0.2376 | 0.2439 | 羅馬尼亞語 | 0.2347 | 0.2337 | 0.2380 |
土耳其 | 0.2336 | 0.2336 | 0.2376 | 0.2439 | 土耳其 | 0.2353 | 0.2337 | 0.2379 |
伊拉克 | 0.2303 | 0.2351 | 0.2375 | 0.2447 | 伊朗人 | 0.2363 | 0.2338 | 0.2381 |
格魯吉亞 | 0.2304 | 0.2345 | 0.2372 | 0.2442 | 格魯吉亞 | 0.2332 | 0.2332 | 0.2378 |
阿塞拜疆 | 0.2304 | 0.2365 | 0.2386 | 0.2465 | 列茲金人 | 0.2367 | 0.2352 | 0.2398 |
伊朗人 | 0.2310 | 0.2364 | 0.2391 | 0.2434 | 伊朗人 | 0.2414 | 0.2361 | 0.2383 |
注:帶下劃線的條目在每個麵板中都明顯較小。地理位置上最近的非猶太人口被視為鄰近人群。最後兩列中的距離是猶太社區與平均ASD最低的高加索(亞美尼亞人或格魯吉亞人)或中東(巴勒斯坦人、貝都因人或約旦人)人群之間的距離。
與非猶太人群相比,所有猶太社區都與中東人群有顯著 ( P < 0.01, bootstrap t檢驗 ) 距離,而除中歐猶太人外,與高加索人群的距離明顯更近 (表 1 ,右圖 )。Behar等人 (2010)報告了類似的結果,盡管他們將其斥為“我們計算中的固有偏差”。然而,我們沒有發現此類偏差。中歐猶太人與南歐人群之間遺傳距離較近可以歸因於後期混合。該結果與我們之前支持可薩人假說的發現一致。由於所有猶太社區的唯一共同點是他們與中東人群的不同 (表 1,右圖 ),因此,如果像通常的做法那樣將不同的猶太社區分組而不校正他們的原籍國,則會增加他們的遺傳異質性。
最後,我們對線粒體DNA和Y染色體進行了單親分析,比較了歐洲猶太人與其他人群的單倍群頻率。萊茵蘭假說認為歐洲猶太人的父係和母係祖先均來自中東,而可薩假說則認為他們有高加索血統,同時還分別有來自拜占庭和哈裏發國的南歐和近東移民的貢獻。由於猶太教自公元3世紀才開始由母係遺傳(Patai and Patai 1975),因此線粒體DNA預計會比Y染色體表現出更強的局部女性傾向的奠基者效應。歐洲猶太人與其他人群之間的單倍群相似性被繪製成以地理位置為背景的熱圖(圖7)。所有研究人群之間的成對距離分別顯示在補充圖S6,在線補充材料。
我們的研究結果揭示了性別特異性過程,盡管常染色體數據並不明顯,但與雙親分析中獲得的結果類似。線粒體DNA和Y染色體分析均顯示,歐洲猶太人與植根於高加索的高加索人群之間存在高度相似性(圖7),這支持了可薩人假說。有趣的是,母係血統分析描繪了一個特定的高加索創始血統,其南歐血統較弱(圖7 A),而父係血統則揭示了高加索-南歐雙重起源(圖7 B)。正如預期的那樣,與父係血統相比,母係血統表現出更高的關聯度尺度和更窄的分散性。
通過解剖單親單倍群,我們可以更深入地探究歐洲猶太人的遷徙路線。由於結果沒有具體說明南歐—高加索遷徙是古代還是近代,也沒有表明遷徙的方向(從南歐到高加索還是相反),因此有四種可能的情況。其中,唯一有曆史依據的情況是古代從南歐向可薩利亞的遷徙(6 至 13 世紀)和近代從高加索向中歐和南歐的遷徙(13 至 15 世紀)(Polak 1951;Patai 和 Patai 1975;Straten 2003;Brook 2006;Sand 2009)。從已縮小的可薩利亞向中歐和南歐的西遷將表現出從高加索向歐洲的母係和父係梯度。但並未觀察到這種梯度。相比之下,由猶太化的希臘羅馬男性主導的直接向可薩裏亞的遷移與曆史上的人口遷移相符,並可能造成了觀察到的模式。此外,我們發現歐洲猶太人與裏海以東、黑海以南(界定了可薩裏亞的地理邊界)的人群之間幾乎沒有基因相似性(表1和圖1)。
討論
東歐和中歐猶太人是當代猶太人中最大的群體,約占全球1300多萬猶太人的90%。二戰前,東歐猶太人占歐洲猶太人總數的90%以上。盡管歐洲猶太人的血統存在爭議,但由於其推測的遺傳史(Ostrer 2001),他們仍然是遺傳學和醫學研究中一個極具吸引力的群體。在醫學研究中,校正人口結構和使用合適的對照至關重要,因此確定歐洲猶太人是否屬於閃米特人、高加索人或其他血統至關重要。
盡管猶太教誕生於神學-曆史神話的包圍之中,但從約瑟夫斯·弗拉維烏斯(公元 1 世紀)到 19 世紀,並沒有出現任何猶太史學著作 ( Sand2009 )。早期曆史學家簡單地將現代猶太人與古代猶太人聯係起來 (圖 2 ),以此彌合曆史空白,這一範式後來融入醫學科學,並具體化為一種敘事。許多人對這種敘事提出了質疑 ( Koestler1976 ; Straten2007 ),主要通過表明,如果沒有猶太化的可薩人的重大貢獻,單一的猶太血統無法解釋 20 世紀初東歐猶太人的龐大人口,並表明這種說法與人類學、曆史學和遺傳學證據相衝突 ( Patai and Patai1975 ; Baron1993 ; Sand2009 )。
由於單親和全基因組分析提供的答案並不明確(Levy-Coffman 2005;Atzmon 等人 2010;Behar 等人 2010),歐洲猶太人血統的問題主要在萊茵蘭假說和可薩假說的支持者之間爭論不休。盡管這兩種理論都過分簡化了複雜的曆史過程,但它們因不同的預測和可檢驗的假設而具有吸引力。我們表明,這兩個假設在基因上也是不同的,高加索人群中微量的閃米特血統無法解釋歐洲猶太人和高加索人群之間的相似性。最近獲得的高加索人群基因組數據使我們首次能夠檢驗可薩假說,並促使我們將其與萊茵蘭假說進行對比。為了評估這兩個假設,我們對歐洲猶太人以及可薩人和猶太人群進行了一係列比較分析,每次都提出同一個問題:東歐和中歐猶太人在基因上是否更接近可薩人或猶太人群?根據萊茵蘭假說,歐洲猶太人也預計會表現出較高的族內通婚現象,尤其是在他們的歐亞族群中,並且與鄰近的非猶太人群相比,他們與中東人群的相似性更高;而可薩假說則預測了相反的情況。我們強調,這些假設並非排他性的,一些歐洲猶太人可能擁有其他血統。
我們的 PC、生物地理估計、混合、IBD、ASD 和單親分析一致表明歐洲猶太人具有高加索血統。我們的初步分析揭示了歐洲猶太人和高加索人群的緊密遺傳關係,並指出歐洲猶太人的生物地理起源於可薩利亞南部(圖 3和4)。我們後來的分析產生了一個複雜的血統,其中近東-高加索血統略占主導地位,南歐和中東血統占很大比例,東歐血統貢獻較小;後兩者區分了中歐和東歐猶太人(圖 4和5以及表 1)。雖然中東血統在 ASD 和單親分析中逐漸消失,但南歐血統仍然存在,這可能證明其時期較晚(表 1和圖 7)。
我們表明,可薩人假說對結果提供了全麵的解釋,包括已報道的南歐(Atzmon 等人,2010 年;Zoossmann-Diskin,2010 年)和中東血統(Nebel 等人,2000 年;Behar 等人,2010 年)。相比之下,萊茵蘭假說無法解釋歐洲猶太人中大量的高加索成分(這在非高加索人群中很少見)(圖 5),也無法解釋歐洲猶太人和高加索人群共享的大片 IBD 區域,從而證明他們共同且近期的起源。因此,我們的研究結果否定了萊茵蘭假說,支持東歐猶太人起源於猶太-可薩人的論點。因此,我們可以得出結論,源自萊茵蘭假說的將歐洲猶太人概念化為“群體孤立”是不正確的,並且很可能反映了比較分析中缺乏高加索非猶太群體的抽樣偏差。
萊茵蘭假說的主要難點在於,除了缺乏從巴勒斯坦到歐洲的多次移民浪潮的曆史和人類學證據(Straten 2003;Sand 2009)之外,如何解釋東歐猶太人口從五萬( 15 世紀)大幅增長到八百萬( 20 世紀)的現象。造成這一人口增長的年增長率估計為 1.7-2%,比工業革命前 15-17 世紀東歐非猶太人口的增長率高出一個數量級(Straten 2007)。這種增長不可能是自然人口擴張的產物,尤其是受到嚴格的經濟限製、奴役、同化、黑死病和其他瘟疫、強迫和自願皈依、迫害、綁架、強奸、流放、戰爭、屠殺和大屠殺等因素影響的人口增長(Koestler 1976;Straten 2003;Sand 2009)。因為這種非自然的增長率,持續了超過半個世紀,而且隻影響到居住在東歐的猶太人,是難以置信的——人們用奇跡來解釋它(Atzmon 等人,2010;Ostrer,2012)。不幸的是,這種神聖幹預的解釋帶來了一個新的問題——它並非科學。萊茵蘭假說根植於超自然推理,它是如何成為主流科學敘事的,這個問題在學者中一直存在爭議(Sand,2009)。
對我們的發現最簡潔的解釋是,東歐猶太人擁有在高加索地區曆經數個世紀形成的猶太-可薩人血統。早在公元前幾個世紀後期,就有記錄顯示猶太人出現在高加索地區以及後來的可薩利亞,而後由於絲綢之路貿易的增長(圖 1)、猶大的衰落(1 至 7 世紀)以及基督教和伊斯蘭教的興起(Polak 1951)而得到加強。在早期幾個世紀,希臘-羅馬和美索不達米亞的猶太人也普遍傾向於前往可薩利亞,而在可薩人皈依猶太教後,他們的遷徙更加頻繁(Polak 1951;Brook 2006;Sand 2009)。由男性主導的從歐洲到可薩的東遷(圖7)鞏固了可薩基因庫中奇異的南歐血統(圖5),並增加了猶太-可薩人的遺傳異質性。可薩人的宗教皈依影響了帝國的大多數公民和下屬部落,並持續了接下來的400年(Polak 1951;Baron 1993),直到蒙古人入侵(Polak 1951;Dinur 1961;Brook 2006)。在帝國最終崩潰時(13世紀),許多猶太-可薩人逃往東歐,後來又遷移到中歐並與鄰近人群融合。
曆史和考古發現揭示了可薩人皈依後發生的人口事件。在猶太-可薩人存在的五百年間(公元740-1250年),他們派遣分支進入斯拉夫地區,例如羅馬尼亞和匈牙利(Baron 1993),播下了一個龐大猶太社群的種子,該社群後來在可薩人流散中崛起。我們假設,猶太-可薩人在東歐的定居是通過一係列的建國事件實現的,人口通過連續的分裂從高加索地區擴展到東歐和中歐,而子代人口則隨著社會政治條件的變化而擴展到新的領土(Gilbert 1993)。這些事件可能促成了可薩境外猶太社群的更高同質性(表1)。
帝國衰落後,猶太-可薩人難民前往新興的波蘭王國和其他東歐社區尋求庇護,他們在經濟、金融和政治方麵的專業知識在那裏受到重視。在他們遷出之前,猶太-可薩人的人口估計為 50 萬,與四個世紀後波蘭立陶宛王國的猶太人數量相同(Polak 1951;Koestler 1976)。一些猶太-可薩人被留下,主要在克裏米亞和高加索地區,他們在那裏形成了一直延續到現代的猶太人聚居區。15 世紀,一個猶太王子王朝在熱那亞共和國和後來的克裏米亞韃靼人的監護下統治著這裏。可薩民族的另一個遺跡是東北高加索地區的“山地猶太人”(Koestler 1976)。
歐洲猶太人與居住在古代可薩利亞兩端的亞美尼亞人、格魯吉亞人、阿塞拜疆猶太人和德魯茲人等人口有著驚人的接近性(圖 3和補充圖S2,補充數據和S5,補充材料在線),支持近東-高加索地區存在共同的血統。萊茵蘭假說無法解釋這些發現,而且由於這些人群在過去八個世紀中經曆的不均衡的人口變化過程,這些發現令人震驚。歐洲猶太人和亞美尼亞人與格魯吉亞人相比,觀察到的遺傳相似性略高(圖4和補充圖S5–6,(見補充材料在線和表1)尤其令人困惑,因為亞美尼亞人和格魯吉亞人是非常相似的群體,他們有著相似的遺傳背景( Schonberg等人,2011)和悠久的文化聯係史( Payaslian,2007)。我們推測,亞美尼亞人身上存在少量的中東血統,而格魯吉亞人則沒有,這可能是亞美尼亞人和歐洲猶太人之間遺傳高度相似的原因(補充圖S6,補充材料在線)。由於可薩人阻擋了阿拉伯人進入高加索的通道,我們懷疑這個血統是由很早就到達亞美尼亞的猶太人引入的,並被吸收到當地人群中,而到達格魯吉亞的猶太人則避免了被同化( Shapira 2007)。這裏和文獻中報道的歐洲猶太人和德魯茲人的親緣關係( Behar et al. 2010)可以用德魯茲土耳其-南高加索的起源來解釋。在十字軍東征期間,德魯茲人移居到敘利亞、黎巴嫩,並最終在 11 世紀到 13 世紀移居到巴勒斯坦,當時巴勒斯坦的猶太人口處於最低水平。因此,歐洲猶太人和德魯茲人在基因上的相似性支持了可薩人假說,不應將其與閃米特起源混淆,閃米特起源很容易與非閃米特起源區分開來(圖 5)。我們強調,隻有針對中東本土群體才能檢驗歐洲猶太人的中東血統。總體而言,歐洲猶太人與高加索人群之間的相似性凸顯了歐亞猶太人與非猶太高加索人群之間存在的基因連續性。
這種遺傳連續性並不令人驚訝。高加索基因庫由於舊石器時代晚期(或新石器時代)的遷徙而從近東基因庫中增殖而來,並受到顯著遺傳漂變的影響,這是由於極端山區景觀的相對隔離(Balanovsky 等人,2011 年;Pagani 等人,2011 年)。因此,預計高加索人群在遺傳上與南歐和中東人群不同(圖 5),但與土耳其人、伊朗人和德魯茲人等近東人群具有一定的遺傳相似性。在我們所有的分析中,中東樣本聚集在一起或沿地理梯度表現出高度相似性(圖 3),一方麵與阿拉伯半島阿拉伯樣本有區別,另一方麵與近東-高加索樣本有區別。
我們的研究試圖揭示被遺忘的可薩人,並闡明其曆史上一些最引人入勝的問題。盡管可薩人皈依猶太教的事實毋庸置疑,但這一新宗教的傳播範圍和根基仍存在疑問。盡管歐洲猶太人的樣本量有限,但他們代表了主要猶太居住國(例如波蘭和德國)的成員,並且表現出非常相似的趨勢。我們的研究結果支持從中南歐和美索不達米亞到可薩的大規模遷徙,這重塑了可薩人以及中高加索和上高加索地區其他高加索人群的基因結構。我們的研究結果還支持大規模皈依猶太教後,新移民與猶太-可薩人融合的觀點。另一個耐人尋味的問題涉及可薩人的起源,據推測可薩人是突厥人、韃靼人還是蒙古人(Brook,2006)。正如根據其共同起源所預期的那樣,高加索人群與具有溫和東亞血統的伊朗人和土耳其人表現出高度的遺傳相似性(圖 5和補充圖S6,補充材料在線)。然而,我們發現,與高加索和東歐的貢獻相比,父係突厥的貢獻較弱(圖7)。因此,我們的研究結果支持將突厥人認定為可薩人的祖先,但不一定是主要祖先。考慮到他們的地理位置,可薩人的基因庫很可能也受到了我們數據集中未包含的東歐人群的影響。
我們的研究結果與來自廣泛領域的證據相吻合。語言學發現表明,東歐猶太人是少數以色列-巴勒斯坦猶太移民的後裔,他們與來自高加索、巴爾幹和日耳曼-索布地區的大量皈依猶太教的異質人群通婚(Wexler 1993)。意第緒語是中東歐猶太人的語言,最初是一種斯拉夫語,早期被詞化為高地德語(Wexler 1993)。我們的研究結果也與考古學、曆史學、語言學和人類學研究結果相一致(Polak 1951;Patai 和 Patai 1975;Wexler 1993;Brook 2006;Kopelman 等人 2009;Sand 2009),並且調和了在單親和雙親基因組數據中觀察到的相互矛盾的遺傳學發現。最新的全基因組研究(Atzmon 等人,2010 年;Behar 等人,2010 年)認為歐洲猶太人起源於中東,這一結論並不完整,因為這兩項研究都沒有像本文一樣對可薩人假說進行檢驗。最後,我們的研究結果證實了口述敘事以及描述可薩人皈依猶太教的猶太經典文獻(例如,亞伯拉罕·本·達烏德(Abraham ben Daud)的《卡巴拉之書》(Sefer ha-Kabbalah)[公元 1161 年],以及拉比耶胡達·哈勒維(Jehudah Halevi)的《可薩人》(The Khazars)[公元 1140 年])(Polak,1951 年;Koestler,1976 年)。
盡管對高加索和近東人群的醫學研究不如對歐洲猶太人那樣深入,但歐洲猶太人身上發現的許多疾病也存在於他們的祖先群體中,包括高加索(如囊性纖維化和 α-地中海貧血)、近東(如 XI 因子缺乏症,II 型)和南歐(如非綜合征性隱性耳聾)(Ostrer 2001),證明了他們複雜的多起源性。
因為我們的研究是首次直接對比萊茵蘭假說和可薩假說,所以在解釋某些結果時需要謹慎,因為樣本量較小並且缺乏替代人群。為了檢驗可薩假說,我們使用了一個粗略的可薩人種結構模型。我們的混合分析表明,高加索基因庫中的某些祖先元素可能是可薩人獨有的。因此,使用少量當代高加索人群作為替代人群可能隻能捕捉到可薩人基因譜的某些色調。需要進一步研究來檢驗猶太-可薩人人口結構對猶太人出現在歐洲的貢獻程度(Polak 1951;Dinur 1961;Koestler 1976;Baron 1993;Brook 2006)。這些研究可能會產生比此處測試的更複雜的人口模型,並闡明高加索人群的複雜人口結構。無論這些限製如何,我們的結果在不同類型的分析中都是穩健的,我們希望它們能夠為遺傳學、疾病、醫學和人類學研究提供新的視角。
結論
我們比較了兩種歐洲猶太人血統的遺傳模型,一種描述了可薩人-歐洲-中東混合血統,另一種描述了單一中東血統。我們以當代人群作為古代可薩人和猶大人的替代,並通過一係列全麵的遺傳分析比較了他們與歐洲猶太人的親緣關係。我們的研究結果支持可薩人假說,該假說描述了一個龐大的近東-高加索血統,以及南歐、中東和東歐血統,這與最近的研究以及口頭和書麵傳統相一致。我們得出結論,歐洲猶太人的基因組是古代人群的混合體,包括猶太化的可薩人、希臘羅馬猶太人、美索不達米亞猶太人和猶大人,他們的人口結構形成於高加索地區和伏爾加河沿岸,其根源延伸至迦南和約旦河沿岸。
致謝
作者感謝Brian和Sharon Browning對IBD分析的幫助,以及他的同事們提出的寶貴意見。作者也感謝兩位匿名審稿人提出的建設性意見和建議。
參考文獻
作者注釋
副主編: Dan Graur