我們常說生命的奧秘是遺傳秘碼,而執行遺傳秘碼天書功能的單位卻是基因,英文稱Gene,基因是具有編碼蛋白質功能的一段核苷酸序列,基因有幾種不同的稱呼,按功能概念區分稱基因(Gene);按基因在染色體的位置概念則稱為位點(locus); 按基因在人群中的差別則可稱之為等位體(Allele)。基因是生命體的基本功能單位,在人類染色體中3乘10的9次方(30億)個核苷酸序列中,隻有少數核苷酸序列編碼是基因。
人類曆史上最大的科技項目-人類基因組項目(Human Genome Project)就是為了解破生命的天書-基因的,這項耗資30億美元(實際的花費遠少於此數字),從1989到2001年曆時13年,吸引了世界上數百所大學,好幾萬科研人員的參與,最後終於在2001年由科技界和工業界同時發表結果,破譯了人類的基因天書測出了30億個核苷酸序列的排列順序。
人類基因組裏的基因總數到底有多少呢?這是一個大問題,很多科學家在人類基因組項目未完成之前的估計是10萬基因左右,在人類基因組項目完成後驚奇的發現其實人類基因隻有20000-30000之間,至今最詳細精確的研究結果是21000個左右:
According to the study, published by Michele Clamp and colleagues at the Broad Institute, human gene catalogue’s such as Ensembl, RefSeq, and Vega include many open reading frames that are actually “random occurrences” rather than protein-coding regions — a finding that cuts the number of protein-coding genes in the genome to around 20,500.
(Reference: Distinguishing protein-coding and noncoding genes in the human genome
Proc. Natl. Acad. Sci. USA, PNAS December 4, 2007 vol. 104 no. 49 19428-19433)。
既然我們已經知道人類生命中隻有區區21000左右基因,而人體內的蛋白質總數在10萬左右,那麽許多基因不止隻編碼一種蛋白質,許多基因可能協同作用來編碼不同的蛋白質。筆者從上研究生起就一直有有這樣一個問題,什麽是機體裏最重要的基因?!長期以來,沒有人願意回答這個問題,也很難回答這個問題。原因也是眾所周知的,因為生命體是非常複雜的,機體是有係統,組織,器官,細胞和基因組成的,各個層次,各個結構之間都緊密相連,相互協同,相扶相成的。
曆史的來看,在好多人類基因組裏的基因都是經過了長期,廣泛和細致的研究的,有很多是非常著名的,比如P53基因,P53基因能夠編碼一種分子量為53kDa的蛋白質,命名為P53。p53基因的失活對腫瘤形成起重要作用。P53基因與人類50%的腫瘤有關,目前發現的有肝癌、乳腺癌、膀胱癌、胃癌、結 腸癌、前列腺癌、軟組織肉瘤、卵巢癌、腦瘤、淋巴細胞腫瘤、食道癌、肺癌、成骨 肉瘤等等。P53基因是迄今發現與人類腫瘤相關性最高的基因,人們對P53基因的認識經曆了癌蛋白抗原,癌基因到抑癌基因的三個認識轉變,現已認識到,引起腫瘤形成或細胞轉化的P53蛋白是P53基因突變的產物,是一種腫瘤促進因子,它可以消除正常P53的功能,而野生型P53基因是一種抑癌基因,它的失活對腫瘤形成起重要作用.
其他很重要的基因比如轉化生長子(TGF-beta)基因,這也是個廣泛研究並發現是有一係列基因組成的超級家族,它是一個涉及包括發育、傷口愈合及細胞增殖和存活等諸多生物學過程的細胞外配體的大家族。由於這些蛋白質可以兼具促進生長和抑製生長的作用,因此人們認為它們既參與腫瘤的發生和轉移的過程又參與防止這些病理表現型出現的過程。
刺蝟(Hedgehog)基因家族也是個非常重要的超級家族,刺蝟基因家族的表達異常影響到生長發育,造成前腦無裂畸形等發育缺陷性疾病,對麵部和神經係統的中線產生影響。表現為耳低位,雙側唇裂及齶裂、單中央門齒、缺陷性中央神經係統分隔,小頭、眼異常、眼間距縮短、智力發育遲緩、耳聾、驚厥及室間隔缺損,一些嚴重的病例甚至有單眼症。此外,刺蝟基因家族通路中某一部分發生突變,可以發生癌變。已知刺蝟基因家族的病變能夠造成基底細胞癌綜合征、單發基底細胞癌、髓母細胞瘤、腦膜瘤、神經外胚瘤,乳腺癌、食管癌、鱗狀細胞癌和毛發上皮瘤等等。
很多基因對機體的影響不僅具有正反雙向功能,而且還不止作用於一個係統,有的基因參與機體的好幾個係統的病變,像Runx基因家族,Runx-1基因與兒童最常見的癌症—急性淋巴細胞性白血病有關;Runx-2則參與調控成骨細胞分化和骨質形成及自身免疫病;Runx-3與胃癌和直腸癌細胞的形成有關。
從功能方麵,基因可以分類為很多基因家族,例如 腫瘤基因家族:p53, Rb, mTor, TGF-beta, WNT, Hedgehog,,Runx,C-myc, Ras 等等。發育基因家族: FGF,TGF-beta, Wnt, Hedgehog,Notch1 等等。免疫基因家族: Ig家族,TNF,IFN, Foc-P3,PTPN22, IL家族,Th1,Th2和Th17細胞基因等等;炎症基因家族:, TNF, PTPN22,TGF-beta等等;幹細胞基因家族: Oct-3/4, SOX2, c-Myc, and Klf4等等. 細胞調亡基因家族: Caspase1-8,Bcl。。。等等 。
美國《時代》雜誌在2007年評出了當年十大科學發現, 其中的發現之一就是兩本權威期刊 《Cell》及《Science》在2007年11月20日同時刊出來自美國及日本兩個研究團隊的一項報告,證實皮膚細胞經過“基因直接重組(direct reprogramming )”後可以轉化成為具有胚胎幹細胞特性的細胞。這項發現一方麵解決了利用胚胎進行幹細胞研究的道德爭議,另一方麵也使得幹細胞研究的來源更不受限。這兩個研究團對分屬於日本京都大學及美國威斯康辛大學麥迪遜分校的兩個團隊雖然獨立研究,但使用的方法幾乎完全相同,更巧合的是竟然同時分別被兩本期刊審核通過,證明基因直接重組技術的確有效。他們所使用的方式都是利用病毒將四個基因送入皮膚細胞,促使普通的皮膚細胞產生變化,最後成為帶有胚胎幹細胞性質的細胞,稱為誘導式多能性幹細胞 (iPS)。
在這兩個研究團隊中,日本京都大學山中伸彌(Shinya Yamanaka)發現隻需要將四個基因 Oct3/4, Sox2, c-Myc, Klf4 送入已分化完全的小鼠纖維母細胞,即可以把纖維母細胞重新設定變回具分會全能性的類胚胎幹細胞”誘導式多能性幹細胞” (induced pluripotent stem cells, iPS cells)。而美國威斯康辛大學的湯姆森(James Thomson)研究團隊則利用了OCT4, SOX2, NANOG, and LIN28四個核心基因,同樣也可以將人類體細胞重新設定變回幹細胞,成為Ips 細胞。
既然生命體最初是從一個幹細胞發育而成,幹細胞的萬能分化和再生特又使幹細胞具有特殊的重要意義,那麽幹細胞基因家族可是說是生物機體裏最重要的基因家族了,因為幹細胞具有再生和驚人的分化能力,是很多組織,器官和細胞的根源和起始。根據山中伸彌教授和湯姆森教授團隊的研究最初需要四個誘導式多能性幹細胞核心基因Oct3/4, Sox2, c-Myc, Klf4或者OCT4, SOX2, NANOG, LIN28。但是最近德國馬普研究所舒樂教授(Hans R. Schöler)團隊發表在《Cell》上的文章把這項工作推向了更進一步,他們隻用了一個基因OCT-4就成功的在體細胞中誘導出了多能性幹細胞iPS!他們的論文摘要是這樣的:
The four transcription factors Oct4, Sox2, Klf4, and c-Myc can induce pluripotency in mouse and human fibroblasts. We previously described direct reprogramming of adult mouse neural stem cells (NSCs) by Oct4 and either Klf4 or c-Myc. NSCs endogenously express Sox2, c-Myc, and Klf4 as well as several intermediate reprogramming markers. Here we report that exogenous expression of the germline-specific transcription factor Oct4 is sufficient to generate pluripotent stem cells from adult mouse NSCs. These one-factor induced pluripotent stem cells (1F iPS) are similar to embryonic stem cells in vitro and in vivo. Not only can these cells can be efficiently differentiated into NSCs, cardiomyocytes, and germ cells in vitro, but they are also capable of teratoma formation and germline transmission in vivo. Our results demonstrate that Oct4 is required and sufficient to directly reprogram NSCs to pluripotency.
值得指出的是舒樂教授是在神經細胞中隻用一個OCT4基因就誘導出了多能性幹細胞,而神經細胞的分化和發育是所有組織細胞中很難的一類,這也從另一個方麵說明了OCT4基因的重要性!OCT4是參與調控胚胎幹細胞自我更新和維持其全能性的最為重要的轉錄因子之一,同時也是體外建立誘導多功能幹細胞(iPS)的關鍵基因。
OCT4基因在幹細胞的增殖、分化、應激反應、凋亡過程等多個生物學過程中發揮著重要作用。OCT4基因含有一種叫POU的功能區域,POU的意思是(Pit Oct Unc),POU編碼的POU蛋白DNA結合蛋白,對維持細胞多能性有重要作用。相信對與OCT4的研究將會訊速展開,因為OCT4不隻是一個幹細胞的全能控製基因,也可以說是生命機體裏最重要的一個基因,多年來困擾遺傳學家的疑問現在終於被細胞生物學家回答了!
Named POU (Pit Oct Unc) after 3 such proteins: Pit 1 regulates expression of certain pituitary genes, Oct 1 and 2, that bind an octamer sequence in the promoters of histone H2A and some immunoglobulin genes and Unc 86, involved in nematode sensory neurone development.
(飄俠原創文章,轉載請注明出處)