新冠肺炎病毒的幾種變異體是咋回事
文章來源: Stegy2232020-04-11 13:22:46

新冠肺炎病毒的幾種變異體是咋回事

除了疫情本身這二天網上及朋友之間談論的最多的話題恐怕是新冠肺炎病毒的不同類型及由此引伸出的一些猜想。有些仁者見仁智者見智的味道, 引得三腳貓不由得學習跟進了一把。在這裏分享一下心得,屬於 my two cents.

1.  新冠病毒變異體及分子進化關係分析

所有這方麵的研究涉及幾個基本詞匯和概念:Single Nucleotide Polymorphism (SNPs) 單個位點核苷酸多樣化。單個核苷酸變異是個普遍現象,存在於所有物種中。己知每個人的基因組中大約有4-5百萬個SNPs.  平均每1000個核苷酸中會發生一個變異。 SNP念Snip 而不是S-N-P.  從讀音就可聽出這是屁大點的小變化,大多數情況下無明顯功能性意義。新冠肺炎病毒(SARS-CoV-2)基因組全序列約3萬個核苷酸。目前從全球基因組全序列(約1600)中已觀察到250多位點有SNPs.

談SNPs就得用到二個詞匯: synonymous (同突變) and non-synonymous (異義點突變)。Synonymous -  單個核苷酸變異不影響轉譯(即編碼的氨基酸殘基)。Non-Synonymous - 單個核苷酸變異 導致編碼不同的氨基酸殘基。更有甚者,單個核苷酸變異亦可能導致蛋白鏈提前中斷,相反亦可能導致出現一新蛋白鏈的起始點(ATG) 。

簡單說來,Synonymous單核苷酸變異應沒有功能性影響,從進化篩選的角度看多為中性的。Non-Synonymous 單核苷酸變異取決於具體氨基酸殘基的變導是什麽及該氨基酸殘基在蛋白質三維結構中的具體位置,對該蛋白質功能的影響可以不大 (conservative mutation) 也可能巨大。這些都會經過進化/演化的篩選,  有利於複製生存的變異就會被保留和在後代中擴大(Positive selection),不利於複製生存的變異就會被篩選去掉(Negative selection)。所謂適者生存。

單個核苷酸變異(SNP)本身大多無功能性意義。但當幾個不相關的隨機變異總是同時出現在一些樣本基因序列中那就有點意思了。從散布於基因序列中眾多的SNPs(背景雜音)中準確地抓出有相聯性的幾個SNPs就是相聯性/相關性分析(linkage analysis)。打個比在刑事破案中如在某嫌疑犯處發現一可能與受害者有關的小物件(一個SNP), 不能絕對說明問題,但如發現二件,三件... 最終就可能形成 beyond reasonable doubt  的定論了。

把己知的基因組序列對比排列好(Multiple alignment) 然後再用不同的模型計算分子進化關係及畫出進化樹就是各種phylogenetic analysis。國家地理雜誌上有篇科普文圖文並茂,感興趣的可以去看看。"How coronavirus mutations can track its spread and disprove conspiracies".

對SARS-CoV-2/Covid-19病毒基因組分子進化及時和全麵跟蹤做得很好的是Next strain 網站。可以清楚地看到有三大分枝。橫軸是時間軸,早期病例出現於中國武漢一帶。

2.在談目前熱門的英國德國科學家PNAS一文之前,先來介紹一下一篇還沒大名氣的由幾位中美華人學者(Zhang LS et al)發表的預印版論文“Genomic variation of SARS-CoV-2 suggest multiple outbreak sources of transmission”。 大體思想與PNAS是吻合的。 這篇文章細節多一些便於在科普水平談一下。Zhang 等分析了160多全序列後發現3個緊密關聯的點突變位點.  下圖顯示了推測的變異過程。

作者指出被稱為2型的在武漢華南海鮮市場集中爆發。推測最初感染人的是1型,感染發生於武漢華南海鮮市場之外的地點(“somewhere else in Wuhan”).   作者指出這點與報道的最初41個病例中14個無華南海鮮接觸史吻合。

“In summary, our results illustrate the presence of two major genotypes of SARS-CoV-2, suggesting of at least two, possibly three, major outbreak sources (Figure 3). The outbreak in the Huanan market may not be the initiation transmission of SARS-CoV-2 to human, and thus the location of initial transmission to humans remain to be determined.”

“These observations suggest that the outbreak in the Huanan market was triggered by the Type II virus and that the initial transmission of Type I viruses to humans might have occurred somewhere else in Wuhan, probably preceding the outbreak of Type II in the Huanan market. Our speculation is in line with earlier reports that 14 of the first reported 41 cases had no link to the Huanan market”

另外,由北大中科院組成的團隊在國家科學綜述雜誌發表的“On the origin and continuing evolution of SARS-CoV2”一文中關於傳染人後繼續演化重點分析了基於SNPs的二型。該文作者認為這二種型或者出現於最早期人傳染階段或者是中間宿主中。這些猜測有待進一步深入研究及更多數據的發掘。

3.PNAS - SARS-CoV-2分子進化關係網絡及三種類型。 介紹這篇熱門論文的己有幾篇博文, 這裏不做全麵介紹,僅談幾點。Forster 等用的方法不同於一般phylogeny tree分析方法。如前所述,常規方法需把所有的序列排列對齊(multiple alignment) 。而Forster等用的是Characters-based phylogenetic network,  不依懶於首先排列對齊序列。Forster 等的網絡圖確定是否有核心,然後由核心向外擴散(隨著突變點的增加)。從前麵介紹來看Forster 等發現的A,B,C 型談不上太讓人驚豔。該法的優點是有力於詳細追蹤變異體之間的關係。但另一方麵,我們可以注意到Forster等人的分子進化網絡圖沒有時間軸的概念。

Forster等用上海疾控中心Wu等最先發表的nCoV-2019做為參照基因組來標注點突變的位置。A型為T29095→C (同突變), B型為T8782→C(同義突變)和C28144→T (異義突變 Lue→Ser) 。Forster等的A 型和B型與上麵一篇中的A 型和B型講的是同樣的點突變。

Forster 等指出A型又分2亞型。第一亞型T29095C(同突變) 從4名廣東患者中測到。另外3名日本人患者及2名美國人患者帶有另一亞型(有其它變異)。2名美國人在武漢住過。B型集中於中國及東亞。Forster 等指出從數據看B 型再往外傳似乎需要積累更多的突變才行。為什麽會是這樣原因不清楚。作者有二種推測。1) 最初感染人的病毒株情況複雜(complex founder scenario) 或 2) 最初傳染人的 "Wuhan B-type virus" 從免疫學和環境適應角度講更適應於東亞人群。

Forster等的這篇PANS能談的是這篇文章中所有病毒樣品間的關係,最早公布的病人是12月24日。在一篇嚴謹的科學論文中無法談的是發生在這些樣品之前的事,如A型是否“起源”於武漢? 因為就這篇文章而言沒有依據。要談就是猜測了。而目前又可以有不止一種猜測。

為便於說明一點,來一起看一下一種假設情況:如病毒真正在生活於雲南/廣西/廣東的蝙蝠或尚末最終確定的中間宿主體內形成。A型與B型隻是2-3個SNP之差,理論上有可能首次感染人時即同時存在。數人在雲廣一帶首次感染後經高速/高鐵到武漢。最後疫情在武漢於12月開始爆發。我們知道疫情發源於武漢是事實。如果最後真的發現這一假設不是假的能稱“新冠病毒發源於武漢”嗎?

目前還沒有看到任何一篇科學論文能證實或排除上麵這一簡單的小假設。所以總的看來還有許多進一步分析研究工作要做。

參考文獻:

National Geographic https://www.nationalgeographic.com/science/2020/03/how-coronavirus-mutations-can-track-its-spread-and-disprove-conspiracies/#close

Zhang, Liangsheng, et al., “Genomic varations of SARS-CoV-2 suggest multiple outbreak sources of transmission” medRxiv preprint doi: https://doi.org/10.1101/2020.02.25.20027953

Tang, Xiaolu et al “On the origin and continuing evolution of SARS-CoV-2”National Science Review https://doi.org/10.1093/nsr/nwaa036

Forster, P., et al “Phylogenetic network analysis of SARS-CoV-2 genomee” www.pnas.org/cgi/doi/10.1073/pnas.2004999117