風清雲淡

這個世界似乎是真的,又似乎是假的。假變真來真變假,真真假假實難辨。
正文

新冠肺炎病毒的幾種變異體是咋回事

(2020-04-11 13:22:46) 下一個

新冠肺炎病毒的幾種變異體是咋回事

除了疫情本身這二天網上及朋友之間談論的最多的話題恐怕是新冠肺炎病毒的不同類型及由此引伸出的一些猜想。有些仁者見仁智者見智的味道, 引得三腳貓不由得學習跟進了一把。在這裏分享一下心得,屬於 my two cents.

1.  新冠病毒變異體及分子進化關係分析

所有這方麵的研究涉及幾個基本詞匯和概念:Single Nucleotide Polymorphism (SNPs) 單個位點核苷酸多樣化。單個核苷酸變異是個普遍現象,存在於所有物種中。己知每個人的基因組中大約有4-5百萬個SNPs.  平均每1000個核苷酸中會發生一個變異。 SNP念Snip 而不是S-N-P.  從讀音就可聽出這是屁大點的小變化,大多數情況下無明顯功能性意義。新冠肺炎病毒(SARS-CoV-2)基因組全序列約3萬個核苷酸。目前從全球基因組全序列(約1600)中已觀察到250多位點有SNPs.

談SNPs就得用到二個詞匯: synonymous (同突變) and non-synonymous (異義點突變)。Synonymous -  單個核苷酸變異不影響轉譯(即編碼的氨基酸殘基)。Non-Synonymous - 單個核苷酸變異 導致編碼不同的氨基酸殘基。更有甚者,單個核苷酸變異亦可能導致蛋白鏈提前中斷,相反亦可能導致出現一新蛋白鏈的起始點(ATG) 。

簡單說來,Synonymous單核苷酸變異應沒有功能性影響,從進化篩選的角度看多為中性的。Non-Synonymous 單核苷酸變異取決於具體氨基酸殘基的變導是什麽及該氨基酸殘基在蛋白質三維結構中的具體位置,對該蛋白質功能的影響可以不大 (conservative mutation) 也可能巨大。這些都會經過進化/演化的篩選,  有利於複製生存的變異就會被保留和在後代中擴大(Positive selection),不利於複製生存的變異就會被篩選去掉(Negative selection)。所謂適者生存。

單個核苷酸變異(SNP)本身大多無功能性意義。但當幾個不相關的隨機變異總是同時出現在一些樣本基因序列中那就有點意思了。從散布於基因序列中眾多的SNPs(背景雜音)中準確地抓出有相聯性的幾個SNPs就是相聯性/相關性分析(linkage analysis)。打個比在刑事破案中如在某嫌疑犯處發現一可能與受害者有關的小物件(一個SNP), 不能絕對說明問題,但如發現二件,三件... 最終就可能形成 beyond reasonable doubt  的定論了。

把己知的基因組序列對比排列好(Multiple alignment) 然後再用不同的模型計算分子進化關係及畫出進化樹就是各種phylogenetic analysis。國家地理雜誌上有篇科普文圖文並茂,感興趣的可以去看看。"How coronavirus mutations can track its spread and disprove conspiracies".

對SARS-CoV-2/Covid-19病毒基因組分子進化及時和全麵跟蹤做得很好的是Next strain 網站。可以清楚地看到有三大分枝。橫軸是時間軸,早期病例出現於中國武漢一帶。

2.在談目前熱門的英國德國科學家PNAS一文之前,先來介紹一下一篇還沒大名氣的由幾位中美華人學者(Zhang LS et al)發表的預印版論文“Genomic variation of SARS-CoV-2 suggest multiple outbreak sources of transmission”。 大體思想與PNAS是吻合的。 這篇文章細節多一些便於在科普水平談一下。Zhang 等分析了160多全序列後發現3個緊密關聯的點突變位點.  下圖顯示了推測的變異過程。

作者指出被稱為2型的在武漢華南海鮮市場集中爆發。推測最初感染人的是1型,感染發生於武漢華南海鮮市場之外的地點(“somewhere else in Wuhan”).   作者指出這點與報道的最初41個病例中14個無華南海鮮接觸史吻合。

“In summary, our results illustrate the presence of two major genotypes of SARS-CoV-2, suggesting of at least two, possibly three, major outbreak sources (Figure 3). The outbreak in the Huanan market may not be the initiation transmission of SARS-CoV-2 to human, and thus the location of initial transmission to humans remain to be determined.”

“These observations suggest that the outbreak in the Huanan market was triggered by the Type II virus and that the initial transmission of Type I viruses to humans might have occurred somewhere else in Wuhan, probably preceding the outbreak of Type II in the Huanan market. Our speculation is in line with earlier reports that 14 of the first reported 41 cases had no link to the Huanan market”

另外,由北大中科院組成的團隊在國家科學綜述雜誌發表的“On the origin and continuing evolution of SARS-CoV2”一文中關於傳染人後繼續演化重點分析了基於SNPs的二型。該文作者認為這二種型或者出現於最早期人傳染階段或者是中間宿主中。這些猜測有待進一步深入研究及更多數據的發掘。

3.PNAS - SARS-CoV-2分子進化關係網絡及三種類型。 介紹這篇熱門論文的己有幾篇博文, 這裏不做全麵介紹,僅談幾點。Forster 等用的方法不同於一般phylogeny tree分析方法。如前所述,常規方法需把所有的序列排列對齊(multiple alignment) 。而Forster等用的是Characters-based phylogenetic network,  不依懶於首先排列對齊序列。Forster 等的網絡圖確定是否有核心,然後由核心向外擴散(隨著突變點的增加)。從前麵介紹來看Forster 等發現的A,B,C 型談不上太讓人驚豔。該法的優點是有力於詳細追蹤變異體之間的關係。但另一方麵,我們可以注意到Forster等人的分子進化網絡圖沒有時間軸的概念。

Forster等用上海疾控中心Wu等最先發表的nCoV-2019做為參照基因組來標注點突變的位置。A型為T29095→C (同突變), B型為T8782→C(同義突變)和C28144→T (異義突變 Lue→Ser) 。Forster等的A 型和B型與上麵一篇中的A 型和B型講的是同樣的點突變。

Forster 等指出A型又分2亞型。第一亞型T29095C(同突變) 從4名廣東患者中測到。另外3名日本人患者及2名美國人患者帶有另一亞型(有其它變異)。2名美國人在武漢住過。B型集中於中國及東亞。Forster 等指出從數據看B 型再往外傳似乎需要積累更多的突變才行。為什麽會是這樣原因不清楚。作者有二種推測。1) 最初感染人的病毒株情況複雜(complex founder scenario) 或 2) 最初傳染人的 "Wuhan B-type virus" 從免疫學和環境適應角度講更適應於東亞人群。

Forster等的這篇PANS能談的是這篇文章中所有病毒樣品間的關係,最早公布的病人是12月24日。在一篇嚴謹的科學論文中無法談的是發生在這些樣品之前的事,如A型是否“起源”於武漢? 因為就這篇文章而言沒有依據。要談就是猜測了。而目前又可以有不止一種猜測。

為便於說明一點,來一起看一下一種假設情況:如病毒真正在生活於雲南/廣西/廣東的蝙蝠或尚末最終確定的中間宿主體內形成。A型與B型隻是2-3個SNP之差,理論上有可能首次感染人時即同時存在。數人在雲廣一帶首次感染後經高速/高鐵到武漢。最後疫情在武漢於12月開始爆發。我們知道疫情發源於武漢是事實。如果最後真的發現這一假設不是假的能稱“新冠病毒發源於武漢”嗎?

目前還沒有看到任何一篇科學論文能證實或排除上麵這一簡單的小假設。所以總的看來還有許多進一步分析研究工作要做。

參考文獻:

National Geographic https://www.nationalgeographic.com/science/2020/03/how-coronavirus-mutations-can-track-its-spread-and-disprove-conspiracies/#close

Zhang, Liangsheng, et al., “Genomic varations of SARS-CoV-2 suggest multiple outbreak sources of transmission” medRxiv preprint doi: https://doi.org/10.1101/2020.02.25.20027953

Tang, Xiaolu et al “On the origin and continuing evolution of SARS-CoV-2”National Science Review https://doi.org/10.1093/nsr/nwaa036

Forster, P., et al “Phylogenetic network analysis of SARS-CoV-2 genomee” www.pnas.org/cgi/doi/10.1073/pnas.2004999117

[ 打印 ]
閱讀 ()評論 (22)
評論
Stegy223 回複 悄悄話 回複'股聾'的評論:
謝謝留言介紹。先讀一讀學習消化一下。

目前科學界主流認為新冠病毒不是人工基因改造的結果。應該說這一觀點基本是有道理的。
股聾 回複 悄悄話 我看你是行家, 能否鑒定一下匿名"民科"?

https://nerdhaspower.weebly.com/article-in-chinese
Stegy223 回複 悄悄話 NewsWeek 4/17/2020
"Coronavirus Outbreak May Have Started as Early as September, Scientists Say". By Hannah Osborn

https://news.google.com/articles/CAIiECda-hxHX8Q1864z1E9aljwqGQgEKhAIACoHCAow77zbCjDiq8wBMIuWmAY?hl=en-US
Stegy223 回複 悄悄話 4/15/2020
http://news.creaders.net/china/2020/04/
這篇PNAS論文的第一作者、英國劍橋大學(University of Cambridge)基因遺傳學者彼得·福斯特(Peter Forster)在接受美國之音采訪時表示,雖然還無法斷定病毒的確切起源,但可以肯定的是新冠病毒最早是在中國傳播開的,而且病毒最早的流行地點可能並不在武漢,而是比武漢更靠南的廣東。

Stegy223 回複 悄悄話 回複'zzn'的評論 : "很有意思的討論!
Justness 發表評論於 2020-04-11 19:14:03. Forster認為A形從武漢擴散到世界各地。
仔細讀了博主引的Forster的文章,請問Justness您是從文章的哪一句話得出這個結論的?"


有答案了。Forster等沒有證據(沒這個精度)能顯示“從武漢擴散”。 Forster 等在文摘中的原話是:顯示似乎A型需要在獲得了更多點突變後才從東亞擴散至世界各地。

"It's ancestral genome (A) appears not to have spread outside East Asia without first mutating into derived B type."

East Asia 應該不會錯的。

Stegy223 回複 悄悄話 4/12/2020 文學城首頁
"劍橋研究追溯新冠病毒軌跡 起源仍無解"
https://www.wenxuecity.com/news/2020/04/11/9347994.html

Stegy223 回複 悄悄話 Forster等這篇PNAS真成了仁者見人智者見智各取所需了。剛讀到文學城首頁“權威文獻直指Covid-19病毒的朔源和進化”
https://www.wenxuecity.com/news/2020/04/11/9348213.html

作者雲“原文的重點是,通過推導病毒的進化過程來更好地指導隔離和防疫的戰略。所以他們沒有白字黑字地道出病毒發源的結論,經過解讀,總結如下:
所有證據指向新冠病毒發源於武漢;
尚無證據支持所謂的“美國起源說”。”

本人的觀點是受過科學訓練的都知道主要結論強證明寫在文摘中,中強度證明的結論亦可謹慎寫在文摘中。弱證明但作者有觀點的可在討論部分談。Forster 在討論部分都沒有涉及的所謂的“美國起源說”,實在不需要他人解讀放進作者嘴裏。Forster等人想說完全可以在討論部分來那麽一句 Our analysis also sheds some lights on the origin of SARS-CoV-2 ....

Stegy223 回複 悄悄話 回複'枕寒流'的評論: 謝謝留言分享。這裏提出了2個不直接相關的問題:

1. “其實武漢上傳的基因樣本很少”。是的。在病毒學專業討論網站看到過這點被提出來,小樣本。所以不能就A型占多少過度下結論。

2. “美軍到武漢放毒的傳言”。這是個extraordinary claim. Carl Sagan名言“Extraordinar claim requires extraordinary evidence”是科學界共認唯一有效的原則。

枕寒流 回複 悄悄話 其實武漢上傳的基因樣本很少。沒有上傳的裏麵是否有A型的外人不知道啊。在國際索賠的壓力下,中方即便有,現在也不可能上傳A型基因樣本的。
我本來不相信美軍到武漢放毒的傳言。但是,經ABC采訪揭露出美軍情報機構早在11月就預測到疫情大爆發的本領也過於神奇了。看來病毒源頭真不是普通百姓能判斷準的。
Stegy223 回複 悄悄話 回複'wumiao'的評論: "和十七年前的薩斯一樣的病毒株".

分類學上新冠肺炎病毒屬於SARS種,但“是和薩斯一樣的病毒株”是不成立的。從一萬英尺高空往下看啥都是一樣的。對科學研究來說 devil is in the details.

新冠病毒所以被命名為SARS-CoV-2,確有一些獨特之處,所以仍有許多的末知有待於科學地認識和闡述。

科學上的爭論與不顧事實的狡辯不是一回事。理性,思考,辯論,寬容,會有助於越辯越明。
wumiao 回複 悄悄話 和十七年前的薩斯一樣的病毒株,這次想栽贓給別國,還想用科學的名義,真不知道某些國人自己腦袋被驢踢了,還是以為全世界的人都是他們認為的腦袋被他們的驢踢了。
zzn 回複 悄悄話 很有意思的討論!

Justness 發表評論於 2020-04-11 19:14:03
Forster認為A形從武漢擴散到世界各地。

仔細讀了博主引的Forster的文章,請問Justness您是從文章的哪一句話得出這個結論的?
Stegy223 回複 悄悄話 回複'Justness'的評論:
B型在武漢爆發然而卻是A型擴散到世界各地。是巧合還是因為B型對東亞之外的人侵染力低? 感覺這個問題最終科學上會搞出個頭緒的。

“石正麗的雲南蝙蝠樣本( 據說是2013采集的)數據是一月末提交的,數據也可能是假的。”
這是個頭痛的問題了。
Justness 回複 悄悄話 Forster認為A形從武漢擴散到世界各地。

石正麗的雲南蝙蝠樣本數據是一月末提交的,數據也可能是假的。
Stegy223 回複 悄悄話 回複'Justness'的評論:
這篇簡訊寫得好,可做為PNAS一文的輔助讀物。關於A型本身,聽到有觀點認為PNAS 一文說明非起源於武漢的,相反觀點認為PNAS一文說明起源於武漢。個人學習心得是Forster 的方法和結果不能直接解決這個爭論。Forster一文隻是描述了一個事實,即B型-華南海鮮市場-12月爆發時,A型“was present in Wuhan”。這點Zhang等的一文中也明確闡述了。

Justness 回複 悄悄話 Researchers from Cambridge, UK, and Germany have reconstructed the early “evolutionary paths” of COVID-19 in humans – as infection spread from Wuhan out to Europe and North America – using genetic network techniques.

https://www.cam.ac.uk/research/news/covid-19-genetic-network-analysis-provides-snapshot-of-pandemic-origins
Stegy223 回複 悄悄話 回複 'Justness' 的評論 :
之前沒看到。謝謝告知。看文中相關段落如下:
“Analysis of the strains showed type A - the original virus that jumped to humans from bats via pangolins”

從穿山甲直接傳染人的說法並沒有被科學界廣泛接收。原因是穿山甲CoV雖可以解答關於ACE2 受體結合部位的問題 。但其它部分差遠了。經測定並發表於Genbank的?10個穿山甲CoV基因組全序列與SARS-CoV-2隻有?90%的相似性,差太遠。對此有穿山甲CoV與RaTG13 重組的假說。但仍要回答PRRA 插入段怎麽出來的問題。
Justness 回複 悄悄話 https://www.dailymail.co.uk/sciencetech/article-8204255/There-THREE-separate-types-coronavirus.html
Stegy223 回複 悄悄話 回複'Justness'的評論: 謝謝留言!
咋沒有看到PNAS文中那裏明確指出A型起源於武漢。能具體指出文中有關部分嗎?
Justness 回複 悄悄話 Forster等依據樣本,分析出病毒現在已有A,B,C三種類型,由A衍生出B,由B衍生出C。

A型起源武漢。
Stegy223 回複 悄悄話 回複'賭城看客'的評論: 謝謝來訪留言。本來就慢半拍,這幾個月更是蒙了。大家現在身處疫區,各自多保重!
賭城看客 回複 悄悄話 好久不見
登錄後才可評論.