這個大小相當於一根頭發絲的1/30,與人類對病毒的認識大相徑庭。過去一提到病毒就是在分子水平上,由於它們沒有細胞結構,大小一般為在幾十到幾百納米,需要電子顯微鏡放大幾十萬倍才能觀察。
甚至堪比細菌大小
人類發現的首個巨大病毒,就曾經被誤認為是球菌。擬菌病毒最初是在1992年的一次對軍團病研究中發現的,它在變形蟲中,在之後的革蘭氏染色實驗中被錯誤地認為是一種革蘭氏陽性菌,並被命名為“布拉德福德球菌”。
直到2003年,科學家試圖溶解“布拉德福德球菌”的細胞壁但沒有成功,他們決定用電子顯微鏡來觀察它,他們驚訝的發現它就像一個巨型的虹彩病毒(一種呈二十麵體可感染昆蟲,魚和青蛙的病毒),隨後他們證明這個有機體為一種病毒,相關文章發表在了《科學》雜誌上。
革蘭氏陽性菌
因為這樣的一個烏龍事件,目前所有的巨大病毒都被劃分為“擬菌病毒科”,當然這個科的建立是多年後的事情。
媽媽病毒的發現也是由於在過濾富集細菌時,它們會由於個頭太大而留下來,但是卻無法用溶解細菌細胞壁的方法破壞它們的蛋白質外衣。有了“擬菌病毒”的經驗,媽媽病毒很快被鑒定為巨大病毒。
隨後,多個巨大病毒被發現。2011年,Megavirus在智利水體中被發現,2013年,法國科學家在智利水下又發現了當時的最大病毒,直徑達1微米,他們一開始也認為不是病毒,這種智利巨型病毒又稱潘多拉病毒,寓意為打開了“潘多拉的魔盒”。
闊口罐病毒
2014年3月,闊口罐病毒在西伯利亞永久凍土冰芯中被采集到,比當時最大的潘多拉病毒大50%,約1.5微米長。
如今,圖盤病毒的發現又刷新了巨大病毒的“個頭”記錄。
認為這些巨大病毒罕見而特別,可能隻是人類的“一廂情願”。中國疾病預防控製中心病毒病預防控製所研究員劉軍表示,“人類認識到的病毒隻是冰山一角,甚至比例還更少。”科學家預測病毒種類可能高達100萬種,而目前認知的隻有幾千種。“或許在未知的水體中,巨大才是病毒的常態。”劉軍說。
基因序列和功能蛋白才是關鍵
大小並不是讓科學家們驚歎的唯一原因,巨大病毒還在不斷刷新著病毒界基因組的複雜程度。
維基百科的記錄顯示,細小病毒一般隻有數千個堿基的基因組平均大小。相較而言,巨大病毒的基因組龐大複雜地多,例如Megavirus有125萬個堿基對,“媽媽病毒”有119萬餘個堿基對。龐大的基因組給了基因編碼蛋白提供了多種可能。科學家預計上述兩者能編碼1000多種蛋白質。
此次發現的圖盤病毒據稱擁有迄今發現的最完整的轉譯相關基因,預測能表達1425種蛋白質。
Megavirus病毒
“然而它還沒有達到模糊病毒與細菌概念的程度,”劉軍持不同觀點,病毒與細菌的界限並不是用大小來定義的。
病毒的生命活動嚴重依賴宿主細胞,它通過特異的受體結合蛋白,讓細胞受體“接受”自己,促使病毒的囊膜與細胞膜融合,病毒借機把遺傳物質注入宿主細胞,借由宿主細胞內的“原料”開始自我複製,裝配新病毒而後釋放。而目前發現的“大”病毒並未跳出這個範圍。
在生命活動方麵,病毒甚至還不及線粒體更“像”單獨的生命。線粒體是一種細胞器,內涵獨立的DNA遺傳分子,並能夠通過生物化學反應,產生生命活動需要的能量。
因此,測定基因序列僅僅是研究的第一步,了解新病毒的關鍵,是要確定其表達了多少蛋白以及蛋白的功能。由於病毒隻有在宿主細胞中才會進行基因表達、基因組複製和病毒粒子的裝配,因此研究病毒的活動需要借助於特異性宿主細胞。
而目前,人類能夠用特異性宿主細胞分離的病毒,相對於自然界存在的病毒庫來講,可以說是少之又少。因此,近年來科學家們借助於快速發展的深度測序技術和人工智能技術發現新病毒,並對其特征進行研究。
人類認識病毒的能力大幅提升
2016年11月,《自然》雜誌發表中國疾病預防控製中心傳染病預防控製所張永振研究員團隊論文《無脊椎動物RNA病毒圈的重新界定》,通過深度轉錄組測序在220種無脊椎動物中共計發現超過1445種全新的病毒,其中一些病毒與現有已知病毒的差異性足以把它們定義為新的病毒科。
RNA病毒圈的重新界定,就是在原有已知RNA病毒種類基礎之上,發現大量新的RNA病毒,展現給人類一個連貫的、模塊化的病毒基因組進化模式,而不是一個支離破碎的病毒分類體係。
RNA病毒是一大類以RNA而不是DNA作為遺傳物質的重要病毒,與人類健康息息相關,包括艾滋病病毒、重症急性呼吸綜合症(SARS)冠狀病毒、埃博拉病毒、流感病毒等,這類病毒變異相對較快。更值得關注的是,RNA病毒也經常從細胞生物中獲取基因,包括RNA解旋酶、甲基轉移酶基因等。
大量新RNA病毒的發現及其特征研究為完整地了解病毒與宿主的的相互作用和共進化史研究提供了堅實的基礎。
而在《自然》雜誌近日發布的一則消息中,研究人員利用人工智能(AI)發現了近6000種未知的病毒。
研究人員通過對來自不同環境的樣本進行深度測序,通過匹配“特定序列”來尋找未知的病毒。但需要特定序列作為“檢索詞”,更多時候檢索詞未知,就難以尋找。而機器學習通過算法解析數據,從中學習,然後自主分類信息,可以解決“檢索詞”未知的問題。
美國能源部聯合基因組研究所(JGI)的計算生物學家 Simon Roux 訓練計算機識別不常見的 Inoviridae 病毒科的基因序列。Roux提出了一種機器學習算法,其中包含兩組數據:其中一組含有來自已知的Inoviridae的805個基因組序列,另一個含有來自細菌和其他類型病毒的約2000個序列。該算法可以幫助找到區分這兩種序列的方法。
接下來,Roux 向模型上傳大量宏基因組學數據,通過該模型的計算,發現了該數據中包含超過10000個Inoviridae基因組,並可將其分成不同的病毒種,並且,其中一些病毒種類之間的差異如此之大,以至於可能定義新的病毒科。
“隨著人類認識病毒和研究病毒的技術不斷發展,更多新奇的病毒形態正在發現的路上,”劉軍說,“這些發現將有助於人們構建病毒的檢測與監測體係,也有助於提高對由未知病原體引起的傳染病或者說近期世界衛生組織提到的X疾病的認識,從而做到針對性的預防和控製。”