2015 (85)
2023 (1)
癌細胞是怎麽發生的(2)基因及其表達
由於網友的反饋,可能需要增加一些篇幅以補充一些基礎知識,所以不知道分上中下是否能完成。且寫了再說。這段因為涉及很多基本知識,比較枯燥,大家沒興趣可以跳過。
如上篇所說,必須在同一個細胞內,有2種基因都發生了突變,這個細胞才會變成癌細胞。
現在先要簡單講一下基因是什麽。基因是一段DNA。一個能夠用來造一個蛋白質分子的DNA堿基順序鏈,就是一個基因。下麵稍微展開一下
每個細胞都有功能,每個細胞的功能幾乎都是由細胞內外的蛋白質完成的。如果說一個細胞是一個工廠,則每個蛋白質就是一個工人,或一個機器,各有功能。
蛋白質經常被消耗,或要製造新的細胞,所以細胞需要製造新的蛋白質。基因就是製造新的蛋白質的圖紙,在每個細胞的細胞核所含的DNA中。
蛋白質是一根長長的氨基酸鏈,一共有20種氨基酸(即20種不同的鏈節),不同的排列形成幾萬種不同的蛋白質。DNA則是一個極其長的核酸鏈,由4種堿基(即4種不同的鏈節)排列成。每3個堿基可以代表1個氨基酸。如此,根據某一段DNA上的堿基順序,就可以造出某一種蛋白質。就好比在派出所的本子上有很多人的名字,3個字代表1個人,找出一組名字,你可能可以找到一個居民小組。
人體細胞的DNA有29億個堿基。不是所有DNA上的堿基都是基因,最終被用於造蛋白質。大多數蛋白質有一到數百個氨基酸組成,也就是說有幾百個到上千個堿基代表一個蛋白質分子。這段代表了一個蛋白質分子的DNA稱為一個基因。
人體細胞一共有大約2萬多個基因,即2萬多種蛋白質。如果每個需要1千個堿基,也隻需要大約2千多萬個堿基,再加上很多堿基順序(順序,Sequences,即一段堿基組成的DNA)和基因表達的調節有關,比如每段基因的前後甚至中間有很多順序和這個基因的打開,關上,或增加減少表達有關。雖然如此,絕大多數的DNA是由無用的堿基順序或目前還不知道功能的堿基順序組成。
再用個通俗點的比喻。每個蛋白質分子好比一串螞蚱,每串100到數百個。一共有20種螞蚱,每種都有個3個字的名字。20種螞蚱可以組成幾萬種螞蚱串,人體內有2萬多種螞蚱串,遍布於細胞內外,甚至血液中,各種體液中。
DNA好比一根細繩上串著很多小木牌,每個木牌上一個字,趙錢孫李。螞蚱的名字總是由這4個字組成,比如螞蚱的名字可以是趙錢孫,錢錢孫,李錢孫,孫李趙,等等等等,共64個名字。但是隻有20種螞蚱,於是一個螞蚱可以有2-4個名字,比如叫趙錢孫,孫錢孫,李錢孫的可能是同一個螞蚱。
人體細胞內的木牌串很長,上麵有29億個木牌。螞蚱串才2萬多個,僅需要大約2千多萬木牌就可以記錄下這2萬多個螞蚱串上的螞蚱的名字。剩下的那些木牌,要麽和怎麽串這些螞蚱串有關,更多的是沒有任何意義的或目前不知道代表什麽意思的木牌串。
記住這些很重要,下麵討論引起癌症的突變的幾率時有用。
還有網友問,什麽叫表達,激活,打開,關閉等等。
現在可以說明一下這些概念了。人體的每個細胞都有這29億堿基長的DNA,其中含有這2萬多的基因。但不是所有細胞都需要造出這2萬多個蛋白質。各種細胞所含的蛋白質種類是不同的。各種組織器官所以有各自的功能,就是因為其細胞所含的的蛋白質不同,導致結構和功能的不同。
這個細胞利用了某段基因造出了某個蛋白質,我們說這個基因被“表達”了,活被激活了,或被打開了。反之,沒有造這個蛋白質,我們說這個基因沒有被表達,或關閉了。
這就是關於基因及基因表達的一些基本知識。希望有助於理解癌細胞和基因突變的關係,也有助於理解其他和基因有關的疾病的機理。
下篇談基因突變和癌細胞。
回複 'Congill' 的評論 :
嗬嗬,歡迎指出錯誤。
事實上,人體究竟有多少Proteins至今有多種說法。以下是2個比較新的研究結果:
One of the teams, led by Akhilesh Pandey from Johns Hopkins University, identified and annotated proteins encoded by 17,294 genes -- that accounts for around 84 percent of all the genes in the human genome that are predicted to encode proteins (that number is estimated at 19,629, if you’re curious). The team extracted proteins from samples of 30 different tissues, then used enzymes to cut them into small pieces called peptides. They ran the peptides through a series of instruments to identify and measure their relative abundance.
The other team, led by Bernhard Kuster of Technische Universit?t München (TUM) in Germany, assembled protein evidence for over 18,000 genes (or 92 percent of the entire proteome) by compiling raw mass spec data from databases and other analyses that were already available. These include a core of 10,000–12,000 proteins expressed in several different tissues, and to fill in the gaps, they generated their own mass spec data by analyzing 60 human tissues, 13 body fluids, and 147 cancer cell lines.
(摘自網上,鏈接:http://www.iflscience.com/health-and-medicine/first-complete-mapping-human-proteome-discovers-193-new-proteins)
Thank you and I am glad you liked.
再次感謝您的點評。
在human genome project完成之前,人們根據29億堿基長度的DNA,認為人類有至少百萬的基因和蛋白質。human genome project之後,基因的數目大大縮減,現在公認的是2萬左右。
後來的proteome project進一步發現了蛋白質的種類數量,最新的如我前麵回答時引用的,也是2萬左右。
很多蛋白質Modify以後可以有不同的功能數種結構,一般還是算作一種而不是數種。
網上有一篇他人博文可以一讀以供參考:http://blog.drwile.com/?p=8270
==================
大錯特錯!
“It is estimated that the human body may contain over two million proteins, coded for by only 20,000 - 25,000 genes. The total number found in terran biological organisms is likely to exceed ten million”
謝謝點評。科普作品,匆匆寫就,粗陋難免,望多提意見。
問題是,它們的差別就在於基因(DNA)的突變,這是根本差別。細胞的差別,發現治療藥物的困難,會寫到的。
謝謝點評,歡迎多提意見。
謝謝。爭取每天寫出這麽一段。太長寫著累,看得也累(也許有人不累,嗬嗬)。
謝謝你。你的評論很好,讓我試圖寫的趣味些,不然太嚴肅。
讓我有時間看看是否有現成的圖表。還不知道如何插入圖表在博克文章中。待慢慢學習。
謝謝鼓勵。
初次寫這方麵的貼,下次爭取寫得更容易讓不是這個領域的能enjoy。