最近朋友微信發來的一篇報道,介紹的是耶魯大學醫學信息學的助理教授程浩宇(Haoyu Cheng)。他近期在《自然》(Nature)雜誌上發表了一項名為 hifiasm (ONT) 的突破性算法。這個名字聽起來很深奧,隻有拆解開來,才能體會到它的突破性創新和意義。
這裏的 Hifiasm 是算法的名字,“HiFi”代表高保真,意味著它追求像高級音響一樣的精準度,而“asm”則是“拚圖師”(Assembler)的縮寫。至於後綴 ONT(Oxford Nanopore Technologies)則代表了目前國際上最先進的“納米孔”測序技術。過去,這二者就像是兩個跑道上的工匠,很難聯手做點什麽。HiFi 追求極度精準但成本昂貴,ONT 則擅長處理超長片段但過程粗糙,容易出錯。程教授的最新貢獻,本質上是開發了一套聰明的“糾錯係統”,讓原本不兼容的兩套技術完美合體,讓電腦能用相對廉價粗糙的 ONT 數據,拚接出像 HiFi 一樣高清生命圖譜。
這種技術突破,徹底改變了過往人們解讀 DNA 的方式。如果把人體 DNA 比作一本擁有 30 億個字符的超級巨著,那麽DNA測序過程就像是把書撕碎成無數片段再重新拚合。傳統算法在處理大量重複信息時非常吃力,往往需要耗費高昂的成本去獲取超長且極高質量的生物樣本。程教授的新算法則像是一位邏輯縝密的超級玩家,不僅能從普通質量、甚至略顯模糊的數據中精準還原生命藍圖,更在效率上比現有方法快了整整 10 倍,將原本需要數周的計算縮短至一天,大幅降低了對昂貴實驗設備的依賴和成本。
這種效率與精度的飛躍在醫學和法醫學領域具有驚人的應用價值。在醫學上,它實現了“端到端”(Telomere-to-Telomere)的完整組裝。所謂“端到端”,就是指從染色體的最左端一直無縫讀取到最右端,不留下任何一個缺口。對於像脊髓性肌萎縮症(SMA)這樣由高度相似基因導致的遺傳病,新算法能像高清攝像頭一樣分辨並標示出其細微的致病變異。而在警方破案方麵,這項技術更是“陳年積案”的克星。過去,犯罪現場留下的血跡或毛發往往因年代久遠而嚴重降解,DNA 質量極差,導致傳統方法無法得出結果。程教授的算法則能“變廢為寶”,從這些破碎嚴重的樣本中拚湊出關鍵完整證據,從而破解過去難以破解的案件。
程浩宇教授是一位跨界科學家的傑出代表,他本科就讀於合肥科技大學計算機,博士畢業於中國科技大學計算機科學專業。博士後在哈佛醫學院及其頂尖的丹納-法伯癌症研究所(Dana-Farber Cancer Institute),師從生物信息學泰鬥李恒教授。哈佛期間他將計算機算法的強大算力引入了生物醫學最前沿。他曾主導“人類泛基因組”等國際項目,致力於打破基因研究的族群偏見,構建涵蓋全人類多樣性的參考地圖。
程教授是2024年9月加入耶魯的。目前,他在耶魯領導的研究小組正致力於更宏大的目標。他不僅在研究人類,還通過算法重建各種動植物的基因組,這對於考古學溯源人類曆史、保護瀕危物種具有深遠影響。他現在所做的工作,本質上是在用計算機的語言為全人類構建一套精準的生命導航係統。這種從算法入手、為醫學生物服務的跨界創新,不僅展示了個人卓越的科研實力,更彰顯了計算科學在促進人類健康方麵的無限潛力。
我相信,像程教授這樣優秀的華裔學者在美國還有很多。年齡上看,程教授還很年輕,還有大把的時間繼續施展才華,取得更大的成就。
2026.2.22 於美國
(聲明:我不學科學的,隻是想以普通人的視角弄明白這件事的意義,歡迎業內朋友跟帖補充點評)
華裔教授新算法:將顛覆DNA檢測方式
遠遠的霧 (2026-02-23 05:44:53) 評論 (10)最近朋友微信發來的一篇報道,介紹的是耶魯大學醫學信息學的助理教授程浩宇(Haoyu Cheng)。他近期在《自然》(Nature)雜誌上發表了一項名為 hifiasm (ONT) 的突破性算法。這個名字聽起來很深奧,隻有拆解開來,才能體會到它的突破性創新和意義。
這裏的 Hifiasm 是算法的名字,“HiFi”代表高保真,意味著它追求像高級音響一樣的精準度,而“asm”則是“拚圖師”(Assembler)的縮寫。至於後綴 ONT(Oxford Nanopore Technologies)則代表了目前國際上最先進的“納米孔”測序技術。過去,這二者就像是兩個跑道上的工匠,很難聯手做點什麽。HiFi 追求極度精準但成本昂貴,ONT 則擅長處理超長片段但過程粗糙,容易出錯。程教授的最新貢獻,本質上是開發了一套聰明的“糾錯係統”,讓原本不兼容的兩套技術完美合體,讓電腦能用相對廉價粗糙的 ONT 數據,拚接出像 HiFi 一樣高清生命圖譜。
這種技術突破,徹底改變了過往人們解讀 DNA 的方式。如果把人體 DNA 比作一本擁有 30 億個字符的超級巨著,那麽DNA測序過程就像是把書撕碎成無數片段再重新拚合。傳統算法在處理大量重複信息時非常吃力,往往需要耗費高昂的成本去獲取超長且極高質量的生物樣本。程教授的新算法則像是一位邏輯縝密的超級玩家,不僅能從普通質量、甚至略顯模糊的數據中精準還原生命藍圖,更在效率上比現有方法快了整整 10 倍,將原本需要數周的計算縮短至一天,大幅降低了對昂貴實驗設備的依賴和成本。
這種效率與精度的飛躍在醫學和法醫學領域具有驚人的應用價值。在醫學上,它實現了“端到端”(Telomere-to-Telomere)的完整組裝。所謂“端到端”,就是指從染色體的最左端一直無縫讀取到最右端,不留下任何一個缺口。對於像脊髓性肌萎縮症(SMA)這樣由高度相似基因導致的遺傳病,新算法能像高清攝像頭一樣分辨並標示出其細微的致病變異。而在警方破案方麵,這項技術更是“陳年積案”的克星。過去,犯罪現場留下的血跡或毛發往往因年代久遠而嚴重降解,DNA 質量極差,導致傳統方法無法得出結果。程教授的算法則能“變廢為寶”,從這些破碎嚴重的樣本中拚湊出關鍵完整證據,從而破解過去難以破解的案件。
程浩宇教授是一位跨界科學家的傑出代表,他本科就讀於合肥科技大學計算機,博士畢業於中國科技大學計算機科學專業。博士後在哈佛醫學院及其頂尖的丹納-法伯癌症研究所(Dana-Farber Cancer Institute),師從生物信息學泰鬥李恒教授。哈佛期間他將計算機算法的強大算力引入了生物醫學最前沿。他曾主導“人類泛基因組”等國際項目,致力於打破基因研究的族群偏見,構建涵蓋全人類多樣性的參考地圖。
程教授是2024年9月加入耶魯的。目前,他在耶魯領導的研究小組正致力於更宏大的目標。他不僅在研究人類,還通過算法重建各種動植物的基因組,這對於考古學溯源人類曆史、保護瀕危物種具有深遠影響。他現在所做的工作,本質上是在用計算機的語言為全人類構建一套精準的生命導航係統。這種從算法入手、為醫學生物服務的跨界創新,不僅展示了個人卓越的科研實力,更彰顯了計算科學在促進人類健康方麵的無限潛力。
我相信,像程教授這樣優秀的華裔學者在美國還有很多。年齡上看,程教授還很年輕,還有大把的時間繼續施展才華,取得更大的成就。
2026.2.22 於美國
(聲明:我不學科學的,隻是想以普通人的視角弄明白這件事的意義,歡迎業內朋友跟帖補充點評)