潤濤閻的小天地

政治麵目:瓜子臉。要招人恨,恨得咬牙切齒;要惹人愛,愛得死去活來;要讓人服,服得五體投地。
個人資料
潤濤閻 (熱門博主)
  • 博客訪問:
歸檔
正文

“一人打敗全球”的科學家:史密斯(圖)

(2009-02-09 21:40:08) 下一個
“一人打敗全球”的科學家:史密斯(圖)



潤濤閻


2-9-2009


很多科學家提出了與眾不同、前無古人的思路、定理或結論而震驚世界,這些科學家的一部分獲得了諾貝爾獎,如果發生在100年內的話(諾貝爾獎剛好100年了,在這之前也有不少該得獎的科學家),這很正常。這些不是本文要談的。

本文今天要談的內容跟題目吻合,就是說這位科學家是提前提出設想,想申請美國NIH的科研經費,由於他的設想在全球所有國家的同行眼中是地地道道的信口開河,必然遭到了沒完沒了地羞辱---不僅得不到一分錢的資助,而且成為科學家眼裏胡言亂語的典型。

我在前文中一開頭就提到了這位科學家,當時並非要寫他的專文而賣關子。我那篇文章的寫作方式是用電影鏡頭由遠而近的技巧,就是先介紹約翰霍普金斯醫學院所在地,接著是我們所在的樓,然後是我們實驗室,下麵便是實驗室的人物了。文中介紹了那棟樓就是給他蓋的。請看潤濤閻《日本人印度人;猶太人伊斯蘭人》一文。我那篇文章吸引了很多人,有人想知道文中更多的人和事,也有人提出對史密斯感興趣,讓我介紹一下。今晚有點空,就補寫一篇。其他的人物,以後再談。

他的名字全文是漢密爾頓O.史密斯,英文Hamilton O. Smith。他就是本文要介紹的一人抱打全球最後得勝的科學家。

史密斯由於發現了限製性內切酶(Restriction Enzyme)開創了基因克隆新紀元而獲得了諾貝爾獎,那是以前的事了,在此不贅。當DNA順序(生命密碼)的測序方法普及以後,尤其是熒光掃描測序儀的誕生,生物領域裏的科學家們必然想把各個生物的生命密碼解密,也就是把細胞核裏的整個遺傳物質---基因組,稱為染色體的所有堿基對順序搞出來。

為了讓不是在生物領域裏的讀者也能明白到底這生命密碼是怎麽回事,我不得不先給個外行人也能搞明白的解釋。

生命密碼是由四種堿基組成的一個很長很長的鏈條(因為能被染色而被稱為染色體)。不同生物的鏈條數不同,比如人,就有23對。其中有一對是性染色體。那麽,人的23對染色體鏈條拉直並接起來後有多長呢?潤濤閻做過簡單的計算:把一個堿基對放大到一塊一尺長的磚,那這個鏈條就是用四種不同顏色的磚用水泥接在一起(化學名稱就是共價鍵)的薄牆(隻有一磚高)。這個由四種顏色的磚連接起來的長牆恰好一百萬公裏(10億米)!

由於構成這個長鏈的堿基對隻有四種,不同的排列而已,如何完成測序,便是擺在科學家們麵前的難題。

因為必須先把這長鏈用限製性內切酶切成一段段的,把這一段段的DNA裝入載體,載體進入細菌體內進行繁殖,我們才能從細菌體內得到大量的能用於實驗室測序的DNA。還好,每個細菌隻能接受一個載體,這就是所說的“克隆”了,我們就可以純化那一段DNA,測出那一段DNA的堿基對順序。就像知道了這段牆的四種顏色磚的連接順序。

我們測序是通過電泳跑膠,放射性標記,顯影 後讀出DNA順序的。後來有了熒光標記和熒光測序儀,速度增加了很多。工具的革命其重要性不言而喻。

全世界的科學家們無一例外地明白,隻有先給這麽由一百萬公裏長的磚牆每隔一段找出一個標記,然後對每段測序。因為這一百萬公裏長的牆割成一百萬段,分別測序的話,如果不提前標記上哪段跟哪段相連,到頭來就是一鍋粥。反正就那麽四種顏色的磚啊。

所以,包括美國、歐洲、亞洲、南非以及遍布地球上的每個角落的生物科學家都參與了標記定位偉大工程。有的給細菌,有的給真菌,有的給植物,有的給動物(老鼠、人等)標記定位。各就各位,忙得不亦樂乎。

此時,史密斯教授提出了走近路的方法:用shotgun(翻譯成“掃射”法?)可以完成,也就是說,把這個一百萬公裏長的牆切成長短不等的段,隨機裝入載體到細菌體內繁殖,然後測序,抓著誰算誰。他預測:測序讀出30億塊磚的時候,這人體的生命密碼---10億塊磚的四種顏色順序就知道了。也就是說,僅僅三倍於整個基因組的測序就可以把整個基因組圖譜給接上!

要知道,分離細菌DNA的時候,需要大約一萬到一百萬個基因組拷貝進行切割。換句話說,就是這個長牆不是一條長鏈,而是一萬條甚至一百萬條完全相同的牆,每條長度、磚的顏色順序都一模一樣。把這些切割後攪合在一起。

上麵介紹完了專業知識。下麵講史密斯如何一人抱打全球的。精彩的故事便開始了。

他提出了這個“掃射”法測序,他交了申請科學基金的研究報告給NIH,專業術語叫grant.當時NIH正在如火如荼地標記定位基因組,就是上麵說的給這個一百萬公裏長的由四種顏色的大磚連成的牆做標記。看到史密斯的申請報告,審批者們愣了:這是諾貝爾獎得主漢密爾頓.史密斯?他的腦袋灌了水了?

按照最簡單的數學計算,全世界正在標記定位基因組的科學家們都停下來跟著史密斯搞掃射法測序的話,那幾十年也幹不完啊!因為要反複重複同一段,而隻差哪怕幾個堿基對都無法知道哪跟哪對接!史密斯竟然說他自己一個實驗室就能用這種掃射法五年內完成一個細菌基因組的測序,要對接成功。細菌的基因組雖然比人比老鼠小得多,但無論如何也是信口開河。問題在於:這種掃射法根本行不通!

史密斯不依不饒,非要自己證明自己的預測是對的不可。可他沒錢買熒光測序儀器,他有個曾經是護士的妻子,可以幫忙。這樣,兩口子就每天用手工方法測序,白天兩口子跑電泳,晚上洗出照片後用放大鏡讀堿基對順序。

有一位在美國的日裔科學家叫K.山本(Keith Yamamoto)加州大學教授,他認為,NIH給那麽多實驗室經費搞基因組定位標記,就不能給史密斯一點錢搞點有風險但與眾不同的研究嗎?

NIH的主席發話了:我們不能因為史密斯是諾貝爾獎得主,他信口開河的胡亂搞也要給錢。他能說服誰呢?這又不是什麽神秘的東東?如果諾貝爾獎得主就可以信口開河而給錢,那諾貝爾獎提名人給不給?其他科學院院士給不給?這個要一視同仁,除非改變NIH審批規則。

醫學界數學好的海著去了,就拿史密斯本人來說吧,他的大學就是在伯克利數學係念的,他的學士學位就是數學。你史密斯自己算算你那方法能對接上嗎?

史密斯每年都申請,每年的申請內容都差不多,反正就是簡單不能再簡單的掃射法。

NIH每年都駁回史密斯的申請,每年的駁回內容都差不多,反正就是您老信口開河,專業術語就是“沒有依據,風險太大”。

NIH按照投資的思路,就是不搞“風險投資”這是NIH通過的基金審批規則:“有風險,不給錢。”道理就這麽簡單。

這個世界總有迷信者。

史密斯此時有一個迷信者。其他迷信者不重要,這位迷信者重要,重要之處不在於他多有名氣,山本有名氣,沒用。這位迷信者有用,因為他有錢。

這個事件後,潤濤閻突然醒悟:迷信是不能、也不應該破除的。

迷信史密斯的這位看到了DNA測序的時髦,便辦了測序公司,就是買一台熒光測序儀,給各個實驗室的科學家們測序。你出錢,把樣品給他,他給你測序,告訴你你那段DNA的四個堿基對順序。他的生意紅火起來了,就多買熒光測序儀器,滾雪球。他看到史密斯兩口子用肉眼讀片子,便說我給你測序,不要錢。史密斯說,那就是合作了。成!二人一拍即合。

當全球的科學家們轟轟烈烈地給不同物種的基因組標記的時候,突然看到三大頂尖雜誌(細胞、自然、科學)中的《科學》刊登出來了人類曆史上第一個完成了生物基因組全部順序解密的論文,全都傻眼了!人家都把整個基因組的堿基順序搞完了,我們還搞什麽搞?標記標記,定位定位,扯什麽扯?封麵看完了,打開裏邊的文章定睛一看,竟然是史密斯和他的粉絲們用掃射法搞出來的!

美國國會不幹了!憑什麽花這麽多錢搞標記,而不給史密斯一分錢?!

NIH的總頭隻好辭職了。山本教授立刻被招,組成NIH經費審批改革。山本教授著實風光了一陣。在他的主持下,NIH改革了grant 的規則。那是1997年的事了,但今天的5項規則,依然有效。其中之一就是要有“創造性”就是Innoative。史密斯改寫了美國NIH的曆史。

史密斯本人很低調,那時間你在報道上看到的都是別人的評論,為他鳴不平。照片也是山本先生,報紙雜誌都是他。

史密斯的文章出來後,全球所有正在忙於搞標記的立刻停了下來,全部采用史密斯的掃射法。很快大家就看到了一個個生物,從細菌到真菌到老鼠到人,基因組的測序報告。

所有的測序結果證明:平均隻有2.5倍於總長度,這掃射法就可以把整個順序對接。比史密斯預測的工作量還小。

有人事後說史密斯是碰巧了有個有熒光測序儀器的粉絲加入,否則,靠老兩口子人工測序,靠放射性顯影後用放大鏡讀,他至少還需五年完成。但事實是:即使沒有粉絲用熒光測序儀幫忙,他兩口子照樣抱打全球!因為完成基因組標記,全世界在這個領域裏的科學家們通力合作,也要10年甚至15年才能完成。不論有沒有資助,不論有沒有粉絲加入,史密斯與全球成千上萬的科學家對打,而且是人工對付機器,史密斯都是贏定了。

當時我每天看到史密斯夫婦起早貪黑地幹,恨不得自己是個富豪,買台熒光測序儀器給他,不論他的結論是對是錯,社會總不能這麽對待一位癡情、好勝的長者。尤其是他沒錢,實驗室縮小到了隻有半間。而我們那座大樓當初就是給他蓋的。

史密斯的故事告訴人們:真理總是在少數人手裏。

大家都有這麽個共識:“群眾的眼光是雪亮的。”潤濤閻也承認這句話當真,隻是需要給大家解釋一下這句話:

雪是亮的,但不透明。別說雪山下麵覆蓋著的是鐵礦石還是花崗岩,就是一層薄雪下麵是紅土還是黃土,群眾的眼光是無法得知的。

當極少數智者把真理告訴群眾後,群眾慢慢地明白了,其結果就是用這點知識頑固地反對新的智者的新知識。群眾的眼光隻有條件反射的功能。

群眾的眼光是雪亮的,不透明;智者的眼光是水晶的,能看透本質。

史密斯的故事表明:一些數理化常識在微觀領域未必那麽鐵板一塊。潤濤閻曾經請教過史密斯教授一個問題:如果把DNA堿基對放大至一尺長的一塊磚,人的基因組就是一百萬公裏。那DNA合成酶合成DNA的速度就是每小時一百一十公裏,相當於大約70邁。DNA合成酶把四種顏色的磚用水泥連成一個長鏈,磚的順序是根據母鏈做模板,一旦發現剛連上的那塊磚的顏色不對,立刻刹車,把剛才那塊錯的磚拆下來,再把對的顏色的磚接上。問題是:這麽快的速度,它是怎麽刹車的呢?汽車跑70邁,急刹車,那也不可能一塊磚的打滑都不發生,何況這合成酶是在細胞液裏,怎麽刹車?在水裏的潛水艇最大航速也不過是合成酶的一半不到,潛水艇立刻刹住要走很遠一段距離,別說連一塊磚的距離都不能超過,對潛水艇來說是無法辦到的。史密斯教授聽後哈哈一笑,說這個問題好玩。

是的,宏觀的數理化常識未必適合於微觀領域,至少不是任何時候都能照搬。

我一直納悶的是:史密斯為何對他那些在別人看來是荒唐的預測如此自信呢?難道是因為他相信當初就是這個細菌讓他發現了限製性內切酶而獲得了諾貝爾獎,這個細菌的基因組堿基對順序就得讓他完成?也不管他采用什麽荒唐的方法?

如果說史密斯應該得第二個諾貝爾獎,恐怕生物界的科學家們沒人反對。他的貢獻不僅僅是諾貝爾獎青睞的特立獨行,還在於他一方麵影響了美國NIH的改革,更讓全世界範圍內同行科學家節省了數年的時間和無數的精力。

史密斯寶刀不老,他立刻著手向另一高峰攀登了。他要攀登的他一生中的第三座大山是“人造生物”,就是根據已知的基因組順序,重新人工組裝基因組,創造地球上從未有過的生物。

但願他在有生之年再創輝煌。即使他由於年齡因素無法完成這第三座大山的攀登,他的路子會有粉絲追隨的。



獲得諾貝爾獎時的史密斯教授




當今的史密斯教授


史密斯教授最近幾年的論文:

Gibson, D. G., Benders, G. A., et al.
Complete Chemical Synthesis, Assembly, and Cloning of a Mycoplasma genitalium Genome
Science. 2008 Jan 24;

Lartigue, C., Glass, J. I., et al.
Genome transplantation in bacteria: changing one species to another
Science. 2007 Aug 03; 317(5838): 632-8.

Glass, J. I., Assad-Garcia, N., et al.
Essential genes of a minimal bacterium
PNAS USA. 2006 Jan 10; 103(2): 425-30.

Hutchison, C. A., 3rd, Smith, H. O., et al.
Cell-free cloning using phi29 DNA polymerase
PNAS USA. 2005 Nov 29; 102(48): 17332-6.

Smith, H. O., Hutchison, C. A., 3rd, et al.
Generating a synthetic genome by whole genome assembly: phiX174 bacteriophage from synthetic oligonucleotides
PNAS USA. 2003 Dec 23; 100(26): 15440-5.

Venter, J. C., Smith, H. O., et al.
A new strategy for genome sequencing
Nature. 1996 May 30; 381(6581): 364-6.

Fraser, C. M., Gocayne, J. D., et al.
The minimal gene complement of Mycoplasma genitalium
Science. 1995 Oct 20; 270(5235): 397-403.

Fleischmann, R. D., Adams, M. D., et al.
Whole-genome random sequencing and assembly of Haemophilus influenzae Rd
Science. 1995 Jul 28; 269(5223): 496-512.

Fields, C., Adams, M. D., et al.
How many genes in the human genome?
Nature Genet. 1994 Jul 01; 7(3): 345-6.

[ 打印 ]
閱讀 ()評論 (45)
評論
peacemind2 回複 悄悄話 回複 'clinton-2007' 的評論 :
是啊,我想了一下這其實是一個數學問題,史密斯那麽大名氣,評審人肯定不止一個,這些評審人得有多大偏見不去做一下計算。其實不做計算直觀上也可以明白其中的道理。
peacemind2 回複 悄悄話 "如果把DNA堿基對放大至一尺長的一塊磚,人的基因組就是一百萬公裏。那DNA合成酶合成DNA的速度就是每小時一百一十公裏,相當於大約70邁。DNA合成酶把四種顏色的磚用水泥連成一個長鏈,磚的順序是根據母鏈做模板,一旦發現剛連上的那塊磚的顏色不對,立刻刹車,把剛才那塊錯的磚拆下來,再把對的顏色的磚接上。問題是:這麽快的速度,它是怎麽刹車的呢?汽車跑70邁,急刹車,那也不可能一塊磚的打滑都不發生,何況這合成酶是在細胞液裏,怎麽刹車?"
這個問題很好解答啊,類比有類比的局限性,有質量的車存在慣性需要刹車,而合成酶反應中可能不存在對應的慣性特性不需要刹車。換句話說,這個類比引用了額外的但是不是實際存在的特性。
polar_bear 回複 悄悄話 回複 '梁山石燕' 的評論 : 因為玩不了。
旮旯兒 回複 悄悄話 老閻了不了解,你古拉,特斯拉,人類曆史上的科學巨匠,據說比愛因斯坦牛多了,可好多人卻不知道其人其事,期待老閻的觀點!~
uszxcvbnm 回複 悄悄話 說真的,我們都是人造生物。隻是因為地球被重複毀滅了N次,一切記錄和痕跡都沒有了,人類重複著從石器時代到高科技的發展。但願這一次文明的持續,能讓人類在地球災難性毀滅前找到飛出銀河係的途徑並安全移民。
★火眼金睛☆ 回複 悄悄話 回複梁山石燕的評論:

我C,總有這樣的SB跳出來。沒事趁早死遠!
tibuko 回複 悄悄話 I don't get it. Even if (a) there are 50,000 copies of each segment, (b) 1million segments, so long as each segment is long enough, then it's obvious the shotgun approach would work statistically. NIH's math needs some work?
梁山石燕 回複 悄悄話 潤濤閻曾經請教過史密斯教授一個問題:如果把DNA堿基對放大至一尺長的一塊磚,人的基因組就是一百萬公裏。那DNA合成酶合成DNA的速度就是每小時一百一十公裏,相當於大約70邁。DNA合成酶把四種顏色的磚用水泥連成一個長鏈,磚的順序是根據母鏈做模板,一旦發現剛連上的那塊磚的顏色不對,立刻刹車,把剛才那塊錯的磚拆下來,再把對的顏色的磚接上。問題是:這麽快的速度,它是怎麽刹車的呢?汽車跑70邁,急刹車,那也不可能一塊磚的打滑都不發生,何況這合成酶是在細胞液裏,怎麽刹車?在水裏的潛水艇最大航速也不過是合成酶的一半不到,潛水艇立刻刹住要走很遠一段距離,別說連一塊磚的距離都不能超過,對潛水艇來說是無法辦到的。史密斯教授聽後哈哈一笑,說這個問題好玩。""其實濤哥擅長的是這個領域,隻是可惜為何不去為這這個絕妙的問題尋找答案呢?反而花那麽多時間去灌水,搞些沒多大意義的東西呢?
mmgmmg 回複 悄悄話 回複潤濤閻的評論:
謝謝
潤濤閻 回複 悄悄話 回複mmgmmg的評論:

我文章說的是他在95年發表的細菌,而非後來的人的基因組。由於他用鳥槍掃射法完成了一個細菌的基因組測序,人的基因組測序也就立刻改用此法了。他也是參與者之一。

謝謝您的工作與評論!
mmgmmg 回複 悄悄話 Sorry I can not type Chinese with my computer.

I am very gland to read anther very good paper from潤濤閻. Driving by the curiosity I checked the paper Smith HO published in Science and nature. My software provides an extra very useful information that is the time cited for each papers. Paper #9 published 0n 2001 had been cited most frequently, that is 4,746.

After check with 潤濤閻’s article, I realized that 《科學》刊登出來了人類曆史上第一個完成了生物基因組全部順序解密的論文 should be before 1997. Is it the Paper #28 published 0n 1995, which was cited 3,098 so far.

Dr. 潤濤閻, is there any comments about paper #9?



1. Title: Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome
Author(s): Gibson DG, Benders GA, Andrews-Pfannkoch C, et al.
Source: SCIENCE Volume: 319 Issue: 5867 Pages: 1215-1220 Published: FEB 29 2008
Times Cited: 34


2.
Title: Genome transplantation in bacteria: Changing one species to another
Author(s): Lartigue C, Glass JI, Alperovich N, et al.
Source: SCIENCE Volume: 317 Issue: 5838 Pages: 632-638 Published: AUG 3 2007
Times Cited: 38


3.
Title: Environmental genome shotgun sequencing of the Sargasso Sea
Author(s): Venter JC, Remington K, Heidelberg JF, et al.
Source: SCIENCE Volume: 304 Issue: 5667 Pages: 66-74 Published: APR 2 2004
Times Cited: 894


4.
Title: The genome sequence of the malaria mosquito Anopheles gambiae
Author(s): Holt RA, Subramanian GM, Halpern A, et al.
Source: SCIENCE Volume: 298 Issue: 5591 Pages: 129-+ Published: OCT 4 2002
Times Cited: 739


5.
Title: Genome sequence and comparative analysis of the model rodent malaria parasite Plasmodium yoelii yoelii
Author(s): Carlton JM, Angiuoli SV, Suh BB, et al.
Source: NATURE Volume: 419 Issue: 6906 Pages: 512-519 Published: OCT 3 2002
Times Cited: 318


6.
Title: Sequence of Plasmodium falciparum chromosomes 2, 10, 11 and 14
Author(s): Gardner MJ, Shallom SJ, Carlton JM, et al.
Source: NATURE Volume: 419 Issue: 6906 Pages: 531-534 Published: OCT 3 2002
Times Cited: 78


7.
Title: A comparison of whole-genome shotgun-derived mouse chromosome 16 and the human genome
Author(s): Mural RJ, Adams MD, Myers EW, et al.
Source: SCIENCE Volume: 296 Issue: 5573 Pages: 1661-1671 Published: MAY 31 2002
Times Cited: 178


8.
Title: Complete genome sequence of a virulent isolate of Streptococcus pneumoniae
Author(s): Tettelin H, Nelson KE, Paulsen IT, et al.
Source: SCIENCE Volume: 293 Issue: 5529 Pages: 498-506 Published: JUL 20 2001
Times Cited: 477


9.
Title: The sequence of the human genome
Author(s): Venter JC, Adams MD, Myers EW, et al.
Source: SCIENCE Volume: 291 Issue: 5507 Pages: 1304-+ Published: FEB 16 2001
Times Cited: 4,746


10.
Title: DNA sequence of both chromosomes of the cholera pathogen Vibrio cholerae
Author(s): Heidelberg JF, Eisen JA, Nelson WC, et al.
Source: NATURE Volume: 406 Issue: 6795 Pages: 477-483 Published: AUG 3 2000
Times Cited: 681


11.
Title: The genome sequence of Drosophila melanogaster
Author(s): Adams MD, Celniker SE, Holt RA, et al.
Source: SCIENCE Volume: 287 Issue: 5461 Pages: 2185-2195 Published: MAR 24 2000
Times Cited: 2,668


12.
Title: Complete genome sequence of Neisseria meningitidis serogroup B strain MC58
Author(s): Tettelin H, Saunders NJ, Heidelberg J, et al.
Source: SCIENCE Volume: 287 Issue: 5459 Pages: 1809-1815 Published: MAR 10 2000
Times Cited: 536


13.
Title: Global transposon mutagenesis and a minimal mycoplasma genome
Author(s): Hutchison CA, Peterson SN, Gill SR, et al.
Source: SCIENCE Volume: 286 Issue: 5447 Pages: 2165-2169 Published: DEC 10 1999
Times Cited: 358


14.
Title: Genome sequence of the radioresistant bacterium Deinococcus radiodurans R1
Author(s): White O, Eisen JA, Heidelberg JF, et al.
Source: SCIENCE Volume: 286 Issue: 5444 Pages: 1571-1577 Published: NOV 19 1999
Times Cited: 454


15.
Title: Evidence for lateral gene transfer between Archaea and Bacteria from genome sequence of Thermotoga maritima
Author(s): Nelson KE, Clayton RA, Gill SR, et al.
Source: NATURE Volume: 399 Issue: 6734 Pages: 323-329 Published: MAY 27 1999
Times Cited: 720


16.
Title: Science over politics
Author(s): Lanza RP, Arrow KJ, Axelrod J, et al.
Source: SCIENCE Volume: 283 Issue: 5409 Pages: 1849-1850 Published: MAR 19 1999
Times Cited: 5


17.
Title: Chromosome 2 sequence of the human malaria parasite Plasmodium falciparum
Author(s): Gardner MJ, Tettelin H, Carucci DJ, et al.
Source: SCIENCE Volume: 282 Issue: 5391 Pages: 1126-1132 Published: NOV 6 1998
Times Cited: 350


18.
Title: Complete genome sequence of Treponema pallidum, the syphilis spirochete
Author(s): Fraser CM, Norris SJ, Weinstock CM, et al.
Source: SCIENCE Volume: 281 Issue: 5375 Pages: 375-388 Published: JUL 17 1998
Times Cited: 504


19.
Title: The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus (vol 390, pg 364, 1997)
Author(s): Klenk HP, Clayton RA, Tomb JF, et al.
Source: NATURE Volume: 394 Issue: 6688 Pages: 101-101 Published: JUL 2 1998
Times Cited: 10


20.
Title: Shotgun sequencing of the human genome
Author(s): Venter JC, Adams MD, Sutton GG, et al.
Source: SCIENCE Volume: 280 Issue: 5369 Pages: 1540-1542 Published: JUN 5 1998
Times Cited: 165


21.
Title: Genomic sequence of a Lyme disease spirochaete, Borrelia burgdorferi
Author(s): Fraser CM, Casjens S, Huang WM, et al.
Source: NATURE Volume: 390 Issue: 6660 Pages: 580-586 Published: DEC 11 1997
Times Cited: 968


22.
Title: The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus
Author(s): Klenk HP, Clayton RA, Tomb JF, et al.
Source: NATURE Volume: 390 Issue: 6658 Pages: 364-& Published: NOV 27 1997
Times Cited: 960


23.
Title: The complete genome sequence of the gastric pathogen Helicobacter pylori (vol 388, pg 539, 1997)
Author(s): Tomb JF, White O, Kerlavage AR, et al.
Source: NATURE Volume: 389 Issue: 6649 Pages: 412-412 Published: SEP 25 1997
Times Cited: 25


24.
Title: The complete genome sequence of the gastric pathogen Helicobacter pylori
Author(s): Tomb JF, White O, Kerlavage AR, et al.
Source: NATURE Volume: 388 Issue: 6642 Pages: 539-547 Published: AUG 7 1997
Times Cited: 1,979


25.
Title: Complete genome sequence of the methanogenic archaeon, Methanococcus jannaschii
Author(s): Bult CJ, White O, Olsen GJ, et al.
Source: SCIENCE Volume: 273 Issue: 5278 Pages: 1058-1073 Published: AUG 23 1996
Times Cited: 1,823


26.
Title: A new strategy for genome sequencing
Author(s): Venter JC, Smith HO, Hood L
Source: NATURE Volume: 381 Issue: 6581 Pages: 364-366 Published: MAY 30 1996
Times Cited: 170


27.
Title: THE MINIMAL GENE COMPLEMENT OF MYCOPLASMA-GENITALIUM
Author(s): FRASER CM, GOCAYNE JD, WHITE O, et al.
Source: SCIENCE Volume: 270 Issue: 5235 Pages: 397-403 Published: OCT 20 1995
Times Cited: 1,462


28.
Title: WHOLE-GENOME RANDOM SEQUENCING AND ASSEMBLY OF HAEMOPHILUS-INFLUENZAE RD
Author(s): FLEISCHMANN RD, ADAMS MD, WHITE O, et al.
Source: SCIENCE Volume: 269 Issue: 5223 Pages: 496-512 Published: JUL 28 1995
Times Cited: 3,098


29.
Title: FREQUENCY AND DISTRIBUTION OF DNA UPTAKE SIGNAL SEQUENCES IN THE HAEMOPHILUS-INFLUENZAE RD GENOME
Author(s): SMITH HO, TOMB JF, DOUGHERTY BA, et al.
Source: SCIENCE Volume: 269 Issue: 5223 Pages: 538-540 Published: JUL 28 1995
Times Cited: 119


30.
Title: PLEA TO THE SCIENTIFIC COMMUNITY
Author(s): BALTIMORE D, BERG P, BLOCH KE, et al.
Source: SCIENCE Volume: 216 Issue: 4550 Pages: 1046-1046 Published: 1982
Times Cited: 0


To-morrow 回複 悄悄話 作為一個病理學家,你們的討論有點艱深,但我很有興讀每一個人的見解,很有意思。
下次提問題。
叫我幹嗎? 回複 悄悄話 非常大的可能,本文作者不懂數學。估計隨便一個搞統計的人就能解釋為什麽平均需要的時間是3年左右。雖然我不懂生物科學,但是我記得當初基因的概念被提出來的時候,就是簡單的組合知識,使得發現者大膽提出了基因的概念。
twice10y 回複 悄悄話 James Watson and Francis Collins wasted lots of taxpayer's money and time for human genome project. They said dirty words on Shotgun and thought Craig Venter and Ham Smith had stolen public sequence data. Shame.
FA&TA=FAT 回複 悄悄話 In theory, with 3x coverage, one could recover 95% sequence by chance.
Coverage % Recovery
3x 95
4x 98
5x 99
天涯過客- 回複 悄悄話 既然真理總是在少數人手裏,為什麽總要少數服從多數?:-)
dongfangshaoer 回複 悄悄話 這篇很牛,支持一下:)
999ggg 回複 悄悄話 閻老師是真正的有才,與高人為伍的高人啊!由衷地欽佩您在各個方麵的建樹。全才,俺的偶像,這城裏俺最佩服的人。
Edwardwxc 回複 悄悄話 謝謝樓主,SMITH 是那篇流感嗜血杆菌測序的作者,因為作者人數太多,PUBMED 隱藏了後半部分,我沒看到,這個工作確實開創了鳥槍法隨機測序的先河。不過參考文獻的第二篇他的那篇Genome transplantation in bacteria: changing one species to another的工作爭論很大,雖然礙於這些大牛在學界的影響很多人不敢公開質疑,但確實很多人對這個工作持懷疑態度。原因是這個試驗沒有一個好的對照。這個工作是用一個物種的完整的基因組A,當然是非常小的細菌支原體的基因組,去轉化另一個物種B也是支原體,結果是A 完全轉化了B從而B變成了A。問題是無法確認這個工作的真實性。如果轉化真核細胞,我們可以根據線粒體的母係遺傳,通過檢測線粒體的基因來證明被轉化的細胞,細菌沒有線粒體,很難說得到的轉化細胞是真實的,萬一是不小心汙染,或者是技術員偷懶接種了一個A菌進去了呢?很難說。畢竟轉化用的是一個基因組,而感受態細胞隻是一個很小的細菌--支原體細胞,而且沒有一個對照。

他們這個團隊的合成基因組工作有很強的新聞效應,說是人工合成了生命,很能唬住非專業人士。但是生命不僅僅是DNA, DNA隻是一個程序,一個設定好的信息,如果不能提供讓它表達的環境DNA隻不過是一個多聚核苷酸大分子。這個工作隻不過把一個基因組根據發表的序列分段合成連接在一起,所用的技術方法都是成熟的分子生物學技術,所以在科學上價值很有限,文章能發在SCIENCE上隻能說明這個團隊的人很有影響力(諾獎,院士,新聞名人),並不是他們的工作做得多好。不借助一個活的生物體去真正從零開始合成一個生命,估計還有很長的路要走。不過我還是挺喜歡他的seminar的。
clinton-2007 回複 悄悄話 回複潤濤閻的評論:
30億次就能測出10億鹼基序列不是他計算的結果嗎
我知道他不可能取出一個單獨的DNA測試,測試中有重複片段。
潤濤閻 回複 悄悄話 回複clinton-2007的評論:

您這就錯了。

不能拿出一個細胞的基因組來測序。每段都有上萬個拷貝,你想想看,數學計算能站在史密斯一邊嗎?假如有一萬個拷貝,你要用測序多少個克隆總數?
clinton-2007 回複 悄悄話 回複潤濤閻的評論:
真的啊?真不敢相信NIH的人數學這麽差。值要有高中數學基礎就能明白這個原理啊。當然史能計算出30億次就可測出10個鹼基序列,要有一定的概率知識。史的數學學士學位不是圖有虛名啊。

史的計算結果應該還有一些條件。如平均測試片段長度,測試結果是幾個九的可信度。這都影響他的30億次測試結論。
潤濤閻 回複 悄悄話 回複clinton-2007的評論:

您所說的是對的。隻是這個基因組很大,也就是說很長。而且有數以萬計的拷貝。
clinton-2007 回複 悄悄話 樓主說的史密斯Shotgun方法沒太看明白。是不是假設有一條DNA長鏈順序為:
ABCDEFFG......WXYZ,當然我們事先不知道它的順序是如此的.史的方法就是把N條這樣的DNA長鏈按任意長度截斷為一個個小段。然後隨機測試任意一段,這樣我們就可以知道這一段的DNA鹼基序列。然後假設史在測式M段片段後,發現有一段為ABC,而另一段為BCD,它們有重複序列BC段,所以他就斷定,這兩段相鄰,合起來就組成一個大段為ABCD。以此類推,隻要他測試的段數足夠多,他就能從中組成從ABCDE,,,,,,,WXYZ的完整DNA序列。是這樣嗎?
潤濤閻 回複 悄悄話 回複Edwardwxc的評論:

這篇就是最早的測序文章,我的文章最後倒數第二個索引。您去查查該期雜誌上史密斯的介紹,在同一期上。其他人隻是幫忙的。

Fleischmann, R. D., Adams, M. D., et al.
Whole-genome random sequencing and assembly of Haemophilus influenzae Rd

Science. 1995 Jul 28; 269(5223): 496-512.
潤濤閻 回複 悄悄話 回複Edwardwxc的評論:

您錯了。

1.他的第一個發表的不是人的基因組,而是細菌H. Influenza的測序。那是在《科學》上發表的。

2.人類基因組的測序是後來的事了。我文章指的不是這個,而是第一個。

3.關於掃射法,我文章沒說是史密斯的發明,我本人早就用這個方法。但沒有人認為掃射法能把基因組測序對接。史密斯是唯一一人。受到了NIH不給錢的刁難。我文章給了詳細的說明。那時我在美國,非常清楚這個事的來龍去脈。NIH的頭辭職的時候,很多報紙報道。你如果那時在美國,你就明白了。

4.我給出了他的論文題目,你看看就知道了。在我身邊發生的事,我不會搞錯的。


Edwardwxc 回複 悄悄話 2008年六月在天津醫科大學開會時我見到過他本人,還有他幾個J Craig Venter研究所的同事。據我所了解,他不是第一個提出掃射法(又稱鳥槍法)測序的,而且第一個用掃射法測序的是流感嗜血杆菌,發在《科學》上,作者名單中沒有他的名字。關於人類基因組測序,當時有兩個團隊同時做這個工作,一個是國家資助的,另一個是私人公司。史密斯所在的團隊是私人的,領導人是J Craig Venter,而不是他,並且他們的測序借用參考了很多國家測序團隊公布的結果。發這個文章時,這兩個團隊同時發表的工作,一個是在NATURE(星期三),一個是在SCIENCE(星期四)。關於合成基因組,發起人是J Craig Venter,也不是SMITH。如果你注意到他們所發文章的通訊作者,你就會知道他隻是參與,而不是第一個提出這個IDEA的人,更不要說他是“一人打敗全球”了。
HalfFull 回複 悄悄話 Many overlapping reads for each segment of the original DNA are necessary to overcome the difficulties of shotgun sequencing in order to accurately assemble the sequence. For example, to complete sequencing the human Genome (contains more than 3.2 billion base pairs), most of the human genome was sequenced at 12X or greater coverage; that is, each base in the final sequence was present, on average, in 12 reads. Even so, current methods have failed to isolate or assemble reliable sequence for approximately 1% of the (euchromatic) human genome.
遠去的時光 回複 悄悄話 這事聽起來很蹊蹺, 成功後的反推如果與當時史密斯提出的假設一致, 那他當初為什麽不能給出更令人信服的計算呢?
千江水千江月 回複 悄悄話 專業普及沒怎麽看懂,不過如果我都看懂了當初這個教授就不會沒人幫忙了。我不相信老教授的成功僅在於幸運,他這樣的執著自己的信念一定是有他踏實的理論基礎的。
潤濤閻 回複 悄悄話 回複阿健的評論:

I think people at first hand belived he was lucky. now people think his idea is logic.

every new findings in science will pass three stages: first, people say it is not true;
then, people will say it is true but not important;
and finally, people will say it is true and important, but not new.

smith's theory is "not new" now, though it is true and important (in the last stage of the three stages)


thanks for your comments.
阿健 回複 悄悄話 回複潤濤閻的評論:

(I don't have access to Chinese software at this moment)

I meant, IN THEORY, could his experiment be repeated to produce the same result (of course in a similar time interval). We don't need to re-do it in the lab but only to do a "thought experiment". If it could be repeated, which means his math was VALID and his result was not by luck but logic.
潤濤閻 回複 悄悄話 回複阿健的評論:

您不是火星來的?他當初搞的是細菌,現在那麽多物種的基因組都被測序完了,還怎麽重複?重複幾百遍了啊。連玉米大豆芝麻爛穀子的生命密碼都快搞完了呀。人家都在搞人造生物了。
阿健 回複 悄悄話
他的實驗能重做嗎。如果能、似乎就暗示他在數學上正確。
如果不能、則就象博主說的、是上帝上次幫他而已。

潤濤閻 回複 悄悄話 回複千重雪的評論:

真正的難題不在這裏。這個好解決。




在接頭的地方有重合的克隆就行。見下圖:

A----------------------------B
C----------------D


真正的爭議是:每個基因組每一段都有數以萬計的拷貝,無法得到一個單鏈。這麽多拷貝,他說沒問題,隻要3倍的總長度就可以了。而數學計算不可能。
千重雪 回複 悄悄話 老閻,不做標記,怎麽知道對接是正確的?怎麽證明所接的就是相鄰的兩段?
潤濤閻 回複 悄悄話 答樓下各位:

我沒說掃射是史密斯發明的,早在史密斯之前大家都用。我是說史密斯預測用掃射法不用標記就可以對接,而且隻需要三倍的總長度。

關於數學計算:當年很多數學家參與了計算,跟史密斯對壘。微觀領域裏的現象尤其是生物體內,不是宏觀理論一一對應的。有時間的話,我寫一篇專文來論述其可能性。這篇太長了,不能不停下來。
dahaoren 回複 悄悄話 掃射法不是Craig Venter搞的嗎?
bbbbtttt 回複 悄悄話 按偶的理解,應該又有新的數學理論要誕生了。
小馬識圖 回複 悄悄話 我讚同阿健的意見,他的結論應該在數學上也是正確的,隻是別人沒有理解。
小馬識圖 回複 悄悄話 大牛人啊,佩服!shotgun好像是散彈槍。
老閻,你的流血的婚姻還寫不寫了,我等的太久了。
潤濤閻 回複 悄悄話 回複阿健的評論:

全世界的科學家都是按照概率計算來否定他的。按照數學計算,他是必輸無疑。他的成功在於:上帝偏向他。好比飛機出事了,有人活了,其他人都死了。你要知道為何那個人沒死,隻有上帝有答案。
阿健 回複 悄悄話 抱歉、沒有看懂、但依然好奇。
文中說
把這個一百萬公裏長的牆切成長短不等的段,隨機裝入載體到細菌體內繁殖,然後測序,抓著誰算誰。他預測:測序讀出30億塊磚的時候,這人體的生命密碼---10億塊磚的四種顏色順序就知道了。

他是不是在說一個概率問題呢。就是說他是否找到了一個數學方法呢。如果是、他的方案被否決是因為別人不了解數學部分、還是認為技術部分不可行。謝謝
[1]
[2]
[尾頁]
登錄後才可評論.