今年的諾貝爾化學獎頒給了兩組研究者,他們製造的分析工具極大地提升了蛋白質研究的效率,為生物科學研究和應用帶來了不可估量的巨大影響。
2024年諾貝爾化學獎的主題是蛋白質。化學獎得主大衛·貝克構建出全新的蛋白質,成功完成了幾乎不可能的壯舉。戴密斯·哈薩比斯與約翰·朱默帕開發了一種人工智能模型,解決了一個 50 年前的問題:預測蛋白質的複雜結構。
AlphaFold:
又快又準的蛋白質結構預測
一組獲獎者是戴密斯·哈薩比斯(Demis Hassabis)與約翰·朱默帕(John M. Jumper),他們參與創造了AI蛋白質結構分析工具AlphaFold。
蛋白質的功能是由分子的三維空間結構決定的,因此,想要真正地理解蛋白質如何發揮作用,科學家們就必須準確地掌握蛋白質的空間結構。
蛋白質通常由20種氨基酸組成,但它們可以組合成無數種方式。氨基酸鏈會扭曲和折疊成一個獨特的(有時是獨一無二的)三維結構,正是這種結構賦予了蛋白質功能。
了解組成蛋白質的氨基酸序列是容易的,但確定它具體的空間結構卻相當困難。在過去,確定蛋白質結構依賴X射線衍射、冷凍電鏡等實驗方法。這些方法相當耗時:在晶體時代,弄清一個晶體結構往往就會消耗一個博士生的整個求學生涯。雖然也有早期的分析軟件可用,但它們往往不夠準確,參考價值有限。
而AlphaFold的過人之處就在於它不僅非常快,而且相當準確,因此大大提高了蛋白質研究的效率。
蛋白質結構預測的裏程碑式事件是在2020年的CASP14上,AlphaFold2預測蛋白質的分辨率達到了近原子級別。更重要的是,這些結構在細節上是“對”的——也就是說,在藥物篩選等研究場合,AI的預測結果變得很有用。
在速度上,AlphaFold2也遠遠甩開了實驗手段:消耗一個博士生幾個月甚至幾年的時間才能得到的結構,一張GPU花半個小時就可以得到一個近似的,這在之前是無法想象的。正是依靠這樣的效率,AlphaFold在很短的時間內就預測了六七億個蛋白質結構。
從2018年的1代到2024年的3代,AlphaFold經曆了巨大的升級改進。從采用經典卷積神經網絡架構的初始模型,到引入能力更強的Transformer架構、預測準確率史無前例的2代模型,再到能夠預測“幾乎所有分子類型”的蛋白質複合物結構的3代模型,能力不斷飛躍。
戴密斯·哈薩比斯與約翰·朱默帕使用他們AI模型AlphaFold2,計算了所有人類蛋白質的結構,並預測了目前已知的地球生物共2億種蛋白質的結構。Google DeepMind公開了AlphaFold2 的代碼,到2024年10月,190個國家的200多萬人使用了 AlphaFold2。圖片中為AlphaFold2幫助研究人員的例子。
大約半個世紀以前,有位名叫克裏斯蒂安·安芬森的科學家,他在研究RNA酶的時候發現:對一些蛋白質來說,隻要環境不變,它的天然結構便隻由氨基酸序列決定。換句話說,給定一個氨基酸序列,理論上就可以預測出蛋白質的三維結構。
後來的幾十年間,科學家們在預測蛋白結構的路上艱難地前行,希望有朝一日能把“理論上”這幾個字去掉。
而現在,Alphafold的出現已經讓這個夢想基本成真。
Rosetta:製造全新的蛋白質
與兩位人工智能研究者分享諾獎的是生物化學家大衛·貝克(David Baker),他的研究成果是利用計算機軟件從頭開始設計全新的蛋白質。
這正是蛋白質結構預測的反向操作:這一次,人們輸入的是蛋白質空間結構的“設計圖紙”,計算機會根據圖紙反推出對應的氨基酸序列。隻要按照這個氨基酸序列進行合成,就可以得到人們想要的、具有特定功能的新蛋白質。
在過去,科學家沒有辦法完全憑空設計一種新蛋白質,他們隻能依靠自然界已經存在的蛋白質,然後對它們的結構加以改造。就像是通過改裝鳥來設計飛機一樣,這種改造的方法有很大的局限性而且效率低下。
而貝克和他開發的蛋白質分析軟件Rosetta徹底改變了這種局麵,讓從頭開始輕鬆設計蛋白質變成可能。2003年時,他首次利用軟件成功創造出了一個與天然蛋白質截然不同的新蛋白質:Top7。
大衛·貝克首次創造出了與已知的所有蛋白質完全不同的蛋白質Top7。過去,從事蛋白質設計的研究人員隻能模仿現有結構來創造新蛋白質,但Top7的獨特結構在自然界中並不存在。此外,它含有93個氨基酸,比以前使用“從頭設計”生產的任何蛋白質都要大。
在此之後,Rosetta軟件不斷升級,如今它也與人工智能模型結合了起來。
這些研究如何影響我們?
分析蛋白質結構和設計全新的蛋白質在很多領域都有著重要的應用價值,從這些研究工具中產生的新成果可能也會改變我們的生活。
比如說,這些分析軟件在醫藥領域就有很多應用。很多藥物的作用靶點都是人體內的蛋白質,分析了這些蛋白質的空間結構,就可以高效地篩選能與它結合的分子,進而從中找出具有潛力的新藥。而了解了空間結構特征,也可以設計出相應的新型蛋白質,讓它們成為新的藥物、疫苗或是載體。
貝克實驗室使用計算機軟件Rosetta創造了許多蛋白質,圖片展示了其中幾個例子。大衛·貝克公開了Rosetta的代碼,所有研究者都可以使用該軟件,尋找新的應用領域。
除此之外,也可以把新蛋白質開發成工業催化劑、新型傳感器或是新材料,讓它們在不同領域發揮作用。
有了本屆諾獎得主貢獻的研究工具,這些研發工作都可以以前所未有的速度進行。
參考文獻
[1]https://www.nobelprize.org/prizes/chemistry/2024/popular-information/
[2]https://mp.weixin.qq.com/s/kpsvK65TTIkijtE0eXWrcQ
[3]https://mp.weixin.qq.com/s/KHQz9oV0Sy2XNqPbHFuw3A
2024年諾貝爾化學獎的主題是蛋白質。化學獎得主大衛·貝克構建出全新的蛋白質,成功完成了幾乎不可能的壯舉。戴密斯·哈薩比斯與約翰·朱默帕開發了一種人工智能模型,解決了一個 50 年前的問題:預測蛋白質的複雜結構。
AlphaFold:
又快又準的蛋白質結構預測
一組獲獎者是戴密斯·哈薩比斯(Demis Hassabis)與約翰·朱默帕(John M. Jumper),他們參與創造了AI蛋白質結構分析工具AlphaFold。
蛋白質的功能是由分子的三維空間結構決定的,因此,想要真正地理解蛋白質如何發揮作用,科學家們就必須準確地掌握蛋白質的空間結構。
蛋白質通常由20種氨基酸組成,但它們可以組合成無數種方式。氨基酸鏈會扭曲和折疊成一個獨特的(有時是獨一無二的)三維結構,正是這種結構賦予了蛋白質功能。
了解組成蛋白質的氨基酸序列是容易的,但確定它具體的空間結構卻相當困難。在過去,確定蛋白質結構依賴X射線衍射、冷凍電鏡等實驗方法。這些方法相當耗時:在晶體時代,弄清一個晶體結構往往就會消耗一個博士生的整個求學生涯。雖然也有早期的分析軟件可用,但它們往往不夠準確,參考價值有限。
而AlphaFold的過人之處就在於它不僅非常快,而且相當準確,因此大大提高了蛋白質研究的效率。
蛋白質結構預測的裏程碑式事件是在2020年的CASP14上,AlphaFold2預測蛋白質的分辨率達到了近原子級別。更重要的是,這些結構在細節上是“對”的——也就是說,在藥物篩選等研究場合,AI的預測結果變得很有用。
在速度上,AlphaFold2也遠遠甩開了實驗手段:消耗一個博士生幾個月甚至幾年的時間才能得到的結構,一張GPU花半個小時就可以得到一個近似的,這在之前是無法想象的。正是依靠這樣的效率,AlphaFold在很短的時間內就預測了六七億個蛋白質結構。
從2018年的1代到2024年的3代,AlphaFold經曆了巨大的升級改進。從采用經典卷積神經網絡架構的初始模型,到引入能力更強的Transformer架構、預測準確率史無前例的2代模型,再到能夠預測“幾乎所有分子類型”的蛋白質複合物結構的3代模型,能力不斷飛躍。
戴密斯·哈薩比斯與約翰·朱默帕使用他們AI模型AlphaFold2,計算了所有人類蛋白質的結構,並預測了目前已知的地球生物共2億種蛋白質的結構。Google DeepMind公開了AlphaFold2 的代碼,到2024年10月,190個國家的200多萬人使用了 AlphaFold2。圖片中為AlphaFold2幫助研究人員的例子。
大約半個世紀以前,有位名叫克裏斯蒂安·安芬森的科學家,他在研究RNA酶的時候發現:對一些蛋白質來說,隻要環境不變,它的天然結構便隻由氨基酸序列決定。換句話說,給定一個氨基酸序列,理論上就可以預測出蛋白質的三維結構。
後來的幾十年間,科學家們在預測蛋白結構的路上艱難地前行,希望有朝一日能把“理論上”這幾個字去掉。
而現在,Alphafold的出現已經讓這個夢想基本成真。
Rosetta:製造全新的蛋白質
與兩位人工智能研究者分享諾獎的是生物化學家大衛·貝克(David Baker),他的研究成果是利用計算機軟件從頭開始設計全新的蛋白質。
這正是蛋白質結構預測的反向操作:這一次,人們輸入的是蛋白質空間結構的“設計圖紙”,計算機會根據圖紙反推出對應的氨基酸序列。隻要按照這個氨基酸序列進行合成,就可以得到人們想要的、具有特定功能的新蛋白質。
在過去,科學家沒有辦法完全憑空設計一種新蛋白質,他們隻能依靠自然界已經存在的蛋白質,然後對它們的結構加以改造。就像是通過改裝鳥來設計飛機一樣,這種改造的方法有很大的局限性而且效率低下。
而貝克和他開發的蛋白質分析軟件Rosetta徹底改變了這種局麵,讓從頭開始輕鬆設計蛋白質變成可能。2003年時,他首次利用軟件成功創造出了一個與天然蛋白質截然不同的新蛋白質:Top7。
大衛·貝克首次創造出了與已知的所有蛋白質完全不同的蛋白質Top7。過去,從事蛋白質設計的研究人員隻能模仿現有結構來創造新蛋白質,但Top7的獨特結構在自然界中並不存在。此外,它含有93個氨基酸,比以前使用“從頭設計”生產的任何蛋白質都要大。
在此之後,Rosetta軟件不斷升級,如今它也與人工智能模型結合了起來。
這些研究如何影響我們?
分析蛋白質結構和設計全新的蛋白質在很多領域都有著重要的應用價值,從這些研究工具中產生的新成果可能也會改變我們的生活。
比如說,這些分析軟件在醫藥領域就有很多應用。很多藥物的作用靶點都是人體內的蛋白質,分析了這些蛋白質的空間結構,就可以高效地篩選能與它結合的分子,進而從中找出具有潛力的新藥。而了解了空間結構特征,也可以設計出相應的新型蛋白質,讓它們成為新的藥物、疫苗或是載體。
貝克實驗室使用計算機軟件Rosetta創造了許多蛋白質,圖片展示了其中幾個例子。大衛·貝克公開了Rosetta的代碼,所有研究者都可以使用該軟件,尋找新的應用領域。
除此之外,也可以把新蛋白質開發成工業催化劑、新型傳感器或是新材料,讓它們在不同領域發揮作用。
有了本屆諾獎得主貢獻的研究工具,這些研發工作都可以以前所未有的速度進行。
參考文獻
[1]https://www.nobelprize.org/prizes/chemistry/2024/popular-information/
[2]https://mp.weixin.qq.com/s/kpsvK65TTIkijtE0eXWrcQ
[3]https://mp.weixin.qq.com/s/KHQz9oV0Sy2XNqPbHFuw3A