垃圾DNA?
探索非編碼基因的遺傳密碼,
解讀基因組中“暗物質(zhì)”存在的意義!
數(shù)十年來,我們基因組里有98%的DNA因為沒有編碼蛋白質(zhì)而被稱為“垃圾”。直到最近,這些垃圾區(qū)域重要且顯著的功能才開始為人們所了解。
從罕見的遺傳疾病到唐氏綜合征,從常見的病毒感染到衰老過程——還沒算上六個指頭的貓(以及人類中的同癥狀者)——由基因組中暗物質(zhì)導(dǎo)致的影響是常見、多樣和本質(zhì)性的。
科學家們在這個備受爭議的領(lǐng)域中快速增長的知識已經(jīng)提供了治療失明的成功療法,并挽救了被DNA指紋宣判了死刑的無辜的人,而且很可能帶來對包括肥胖在內(nèi)的很多醫(yī)學疾病的治療方法的革命。
在內(nèi)莎?凱里,也是暢銷書《遺傳的革命》的作者看來,這是一本面對大眾讀者的一個可能會奠定人體復(fù)雜性觀念的圖書。
《垃圾DNA》對非編碼基因作了深入介紹。展示了科學家們在學術(shù)領(lǐng)域逐漸發(fā)現(xiàn)的證據(jù),提示這些所謂的“垃圾DNA”的變異和調(diào)節(jié)與一些難治性疾病有關(guān)。并用不可辯駁的證據(jù)證明了“垃圾DNA”在基因的表達調(diào)控中起著重要且不可預(yù)料的作用,其作用覆蓋從單個基因的微調(diào)到整個染色體的關(guān)閉。這些功能迫使科學家們重新審視關(guān)于“基因”的定義。
《垃圾DNA》是內(nèi)莎?凱里續(xù)《遺傳的革命》出版之后又一部具有高學術(shù)性的相關(guān)遺傳學經(jīng)典力作。作者以令人信服的筆觸為讀者全面介紹了“垃圾DNA”的涵義,及其與遺傳性疾病、病毒感染、哺乳動物性別決定和生命進化的關(guān)系。閱讀本書,我們可以緊跟科學家的腳步迅速進入“垃圾DNA”的領(lǐng)域。而這個具有快速發(fā)展的且頗受爭議的領(lǐng)域,還有廣袤的未知在等著我們?nèi)ラ_發(fā)與探索。
作者序
其實寫一本關(guān)于垃圾DNA的書還是有些困難的,因為它的含義一直都在不斷地演變。有部分原因是新的數(shù)據(jù)會不停地改變我們的舊有觀念,結(jié)果就是,只要一個垃圾DNA被證明事實上具有一定的功能,有些科學家就會說(在邏輯上完全正確)它不再是垃圾。但使用這種方法有可能掩蓋掉這些年來我們對基因組的理解產(chǎn)生了何等翻天覆地變化的過程。
與其花時間在這里糾纏不清,我決定采取一個快刀斬亂麻的方法,使用一個簡單粗暴的定義。把任何不能編碼蛋白的序列都定義為垃圾,如同它在過去最初的定義一般(20世紀下半葉)。純粹主義者會尖叫抗議,但就這樣決定了。問3個不同的科學家什么是“垃圾”DNA,我們可能會得到4個不同的答案。因此,在開始的時候就簡單一點利大于弊。
同樣,我使用“基因”這個詞來描述編碼蛋白的那些DNA序列。這個定義會貫穿本書的始終。
在我的第一本書《遺傳的革命》出版后,我意識到不同的讀者對基因名稱的需求差異很大。有些人喜歡知道我們正在討論的是哪個基因,但對于其他讀者而言,這或許會干擾閱讀的流暢性。所以這次,我只在絕對必要的情況下才使用具體的基因名稱。
對基因組暗物質(zhì)的介紹
想象一下現(xiàn)在你手里有一個戲劇、一部電影、一部電視節(jié)目的劇本。當然,完全可能有人僅僅把劇本當成一本書來看。但是,如果它被用來產(chǎn)生某些東西的時候,它會變得更有力量。在被大聲朗讀出來,甚至被表演出來時,它就不再僅是頁面上的一串字符而已了。
DNA就是如此,它是最杰出的劇本。僅使用4個簡單的字母,它就攜帶了生命的所有編碼,從細菌到大象、從啤酒酵母到藍鯨。但試管中的DNA是很無聊的,它完全沒有用處。而細胞或動物開始用它進行生產(chǎn)的時候,DNA就會變得令人興奮。DNA被作為制造蛋白的編碼,這些蛋白對呼吸、進食、排泄廢物、生殖和所有其他生命特有的活動都至關(guān)重要。
蛋白的功能是如此重要,以至于20世紀的科學家使用它們來界定基因的含義;蚓褪悄軌蚓幋a蛋白的DNA序列。
讓我們來懷念一下歷史上最偉大的劇作家威廉姆.莎士比亞(William Shakespeare)。我們可能需要一段時間才能理解莎士比亞的著作,因為英語從他去世的那個世紀起已發(fā)生了不小的改變。但即使如此,我們?nèi)匀幌嘈,詩人僅書寫了他需要演員說的那些話。
例如,莎士比亞不會像下面這么寫劇本:
事實上,他只寫了劃線部分的單詞:
就是“A rose by any other name would smell as sweet(即使給玫瑰換個稱謂,它依然芳香如故)”。
但如果看看我們自己的DNA劇本,它并不像莎士比亞那些劃了線的詞語那么清晰和緊湊。相反,每個編碼蛋白的區(qū)域就像是漂浮在“廢話海洋”上的一個詞。
多年來,科學家們并不能解釋為什么那么多的DNA不編碼蛋白。這些非編碼的部分被誤會成“垃圾DNA”。但漸漸的,這個看法已經(jīng)被一大堆理由逼迫得站不住腳了。
也許,轉(zhuǎn)變該觀點最根本的原因是源于我們細胞中垃圾DNA那驚人的總量。其中一個最大的沖擊來自2001年人類基因組測序完成的時候,人們發(fā)現(xiàn)人類細胞中98%以上的DNA被劃入了垃圾的行列。它不編碼任何蛋白。上面使用的莎士比亞的比喻實際上是一個精簡了的模型。在基因組里,亂七八糟的文字的比例約為前面提到的亂序劇本的4倍。每一個有意義的字母都對應(yīng)著超過50個字母的垃圾文字。
還有一個類似的比喻。請想象下我們?nèi)⒂^一個汽車廠,這家汽車廠也許像法拉利那么高端。如果我們看到只需要兩個人就能造好一輛炫酷的紅色跑車,而同時又有98個人在一旁無所事事的話一定很驚訝。這顯然是荒謬的,那么為什么這在我們的基因組里是合理存在的?當然,你可以說從共同祖先進化而來的生物往往不是完美的——比如我們?nèi)祟惥痛_實不需要闌尾(本書中作者多次以闌尾為例說明人體確實存在一些無功能的器官,但此觀點尚存爭議,因為有研究者認為闌尾在免疫和消化方面仍具有一定的功能。)——但這次似乎不完美得有點過頭了。
事實上,在我們的汽車廠里,更可能的情況應(yīng)該是,由兩個人組裝一輛汽車,其他的98個人做著其他一切使這家企業(yè)運轉(zhuǎn)的工作。融資、記帳、宣傳產(chǎn)品、處理養(yǎng)老金、打掃廁所和汽車銷售等,這可能是一個更好的垃圾DNA在我們基因組里工作的模式。我們可以把蛋白作為生命所需的最終物質(zhì),但如果沒有垃圾DNA的話,它們永遠不會被正確地生產(chǎn)和整合出來。確實,兩人就能制造汽車,但他們不能保證公司可以出售汽車,也不能把它變成一個強大且成功的品牌。同樣,如果沒有汽車被生產(chǎn)出來,就算有98個員工在展廳拖地板和磨破嘴皮子也沒有任何意義。只有每個組件各司其職的時候整個組織才能運轉(zhuǎn)。而這,就是我們基因組的模式。
另一個來自基因組測序的令人震驚的事實是,使用經(jīng)典的基因模型無法解釋人類極其復(fù)雜的解剖結(jié)構(gòu)、生理功能、智力和行為。在編碼蛋白的基因的數(shù)量上,人體跟簡單而微小的蠕蟲幾乎具有相同的數(shù)量(大約20 000個)。更值得注意的是,大部分蠕蟲的基因跟人類基因可以直接等效。
當研究人員想在DNA水平上深入分析人類與其他生物到底有什么區(qū)別的時候,很明顯,基因不能提供解釋。事實上,遺傳物質(zhì)只有一個特征與復(fù)雜性相關(guān)。這個唯一的隨著動物復(fù)雜性增加而增加的就是垃圾DNA區(qū)域。一個生命體越復(fù)雜,垃圾DNA所占的百分比就越高。只有現(xiàn)在,科學家們才真正開始關(guān)注這個有爭議的觀點,就是垃圾DNA可能是進化復(fù)雜性的關(guān)鍵。
從某個角度看,這些數(shù)據(jù)所引出的問題是很明顯的。如果垃圾DNA是如此的重要,那它到底是干什么的?如果不編碼蛋白,它在細胞中的作用是什么?現(xiàn)在人們逐漸接受了垃圾DNA其實具有多種不同功能的觀點,所以對下面的敘述我們并不會感到吃驚。
它們中的一些在染色體(我們的DNA被打包成的巨大分子)中形成特殊的結(jié)構(gòu)。這種垃圾DNA保護我們的DNA不被解體和受損。隨著我們年齡的增長,這些區(qū)域不斷縮小,最后縮小到臨界程度。之后,我們的遺傳物質(zhì)就變得很容易遭遇潛在的災(zāi)難性的重排,從而導(dǎo)致細胞的死亡或癌變。其他結(jié)構(gòu)類型的垃圾DNA在細胞分裂成子細胞過程中進行染色體均分時作為錨點。(“子細胞”是指由親代細胞分裂產(chǎn)生的細胞。)其他的則作為絕緣結(jié)構(gòu),限制了特定區(qū)域染色體的基因表達。
但是我們很多的垃圾DNA并不僅僅具有上面提到的功能。它確實不編碼蛋白質(zhì),但它卻編碼另外一種分子,我們稱之為RNA。垃圾DNA里面有很大一類在細胞內(nèi)建造工廠,來幫助蛋白質(zhì)的合成。其他類型的RNA分子負責將制造蛋白質(zhì)所需的原料轉(zhuǎn)移到工廠里面。
另外有些垃圾DNA是來自病毒和其他微生物的遺傳物質(zhì)的入侵,它們已經(jīng)如遺傳間諜般融入了人類染色體中。這些早已死去的生物的殘留物對細胞有著潛在的危險,有些在個體中,而有的甚至存在于廣泛的人群中。哺乳動物細胞已進化出多種機制來使這些病毒元件保持沉默,但有的時候這些系統(tǒng)可以被打破。當出現(xiàn)這種問題的時候,它們所產(chǎn)生的影響可以是相對良性的,比如特定種系小鼠毛色的改變,也可以是很嚴重的,比如增加罹患癌癥的風險。
就在前幾年,人們認識到垃圾DNA的一個主要作用其實是調(diào)節(jié)基因的表達。有時候,它在個體上會有巨大的、明顯的效果。比如,一個垃圾DNA就可以決定雌性動物能否保持正確的基因表達模式。它的作用也可以是在群體中的,一個最常見的例子是虎斑貓顏色特征的控制。在極端的例子中,該機制也能解釋為什么有同樣遺傳性疾病的同卵雙胞胎女性會出現(xiàn)截然不同的癥狀。在某些情況下,情況可以極端到雙胞胎中的一個罹患了嚴重危及生命的疾病,而另一個則是完全健康的。
成千上萬的垃圾DNA片段被認為參與了調(diào)控基因表達的網(wǎng)絡(luò)。它們就像是遺傳劇本的舞臺導(dǎo)演一樣,只是其指導(dǎo)對象的復(fù)雜性是我們在劇院里無法想象的。它絕對不是“出去,被熊追趕”那么簡單。而應(yīng)該是類似于“如果在溫哥華和珀斯的暴風雨中表演《哈姆雷特》,就應(yīng)該重讀《麥克白》這一行的第四音節(jié)。除非有個業(yè)余演員在蒙巴薩表演《理查三世》而且基多在下雨!
研究人員剛剛才開始揭開垃圾DNA龐大網(wǎng)絡(luò)中的奧秘和關(guān)聯(lián)的一角。這個領(lǐng)域仍極具爭議。在極端的情況下,有科學家聲稱有些武斷的說法嚴重缺乏實驗證據(jù)的支持。其他有些人則覺得有整整一代科學家(甚至更多)被困在一個過時的模型中而無法看到或者理解這個新領(lǐng)域。
有部分原因是,我們可以用來探索垃圾DNA功能的手段還比較落后。這有時會讓研究人員很難使用實驗來檢驗他們的假設(shè)。確實,我們對該領(lǐng)域的研究時間還相對較短。但有時候,我們可以從實驗室的板凳跟機器旁退出來,去草坪轉(zhuǎn)轉(zhuǎn)。實驗每天都在我們身邊發(fā)生,因為自然和進化已經(jīng)使用了幾十億年的時間來嘗試各種變化。即使僅僅在我們這個物種出現(xiàn)和繁衍的時間段,也已經(jīng)有足夠的時間來進行大規(guī)模的實驗測試。因此,我們將在本書中利用人類遺傳學的火炬來探索黑暗。
可以有許多方法來開始我們的探究基因組暗物質(zhì)之旅,這里,讓我們用一個有些奇怪但不容置疑的事實來開始。一些遺傳病是由垃圾DNA的突變引起的,這應(yīng)該是我們進入隱藏的基因組宇宙的最好起點。