其中之一是蛋白質(zhì)動力學(xué)。他借助鋰化學(xué)的熱力學(xué)原理,以光譜學(xué)研究蛋白質(zhì)如何移動,不是折疊,而是如何移動。他研究當(dāng)?shù)鞍踪|(zhì)移動時,它們是如何影響我們身體功能的。他是我們稱之為生物物理學(xué)科的領(lǐng)軍人物。
Floyd Romesberg踏足的第二個領(lǐng)域是抗生素。他對廣譜或窄譜抗生素概念非常有興趣,成功開發(fā)了兩種革蘭氏陰性效果的抗生素。今年52歲的他已經(jīng)擁有兩家公司,其中一家已經(jīng)上市,另一家公司剛完成一輪總額6500萬美元的投資。
在建立第三個項目的時候,他決定和上帝好好聊聊。所以他花了18年時間去研究核酸,上帝說人只能將ATCG作為DNA序列的密碼,他卻通過疏水作用力用其他分子改變了DNA在新生命體中的編碼方式。在第44期理解未來講座中,F(xiàn)loyd就和我們分享了他是如何和上帝溝通的。下面是Floyd的精彩演講《可儲存與檢索新增遺傳信息的半人工合成生命體》(部分文字有調(diào)整):
我實驗室做的工作是想看看能否可以自己不制造分子和替代品,而是讓人體自身的細(xì)胞為我們制造分子。分子是有可能會根據(jù)我們的需求定制的。因為生命由細(xì)胞構(gòu)成,細(xì)胞都有細(xì)胞核,細(xì)胞核由染色體構(gòu)成,染色體是DNA分子經(jīng)過纏繞與蛋白質(zhì)共同形成的。染色體的分子結(jié)構(gòu),也就是著名的DNA的雙螺旋結(jié)構(gòu)。
DNA就是一個螺旋狀的生物大分子。我們?nèi)祟惖倪z傳信息都儲存在DNA序列中,而DNA用ATCG四種堿基來編碼遺傳信息。這四種堿基相互之間有配對關(guān)系,A和T配對,C和G配對,經(jīng)過配對之后就形成雙鏈結(jié)構(gòu),又因為化學(xué)穩(wěn)定的傾向性,最終形成了雙螺旋結(jié)構(gòu),這就是DNA序列。這個序列有多長呢?有30億個堿基對,也就是30億個A-T、G-C字母對。不同的DNA區(qū)別僅在于字母的排列順序不同。
DNA是可以復(fù)制的。當(dāng)細(xì)胞分裂的時候,細(xì)胞核也要分裂,基因組也會分裂,每次分裂之前它的DNA一定要復(fù)制一遍。怎樣復(fù)制?既然DNA通過ATCG四個字母來編碼遺傳信息,那誰來解碼呢?怎么解碼呢?
負(fù)責(zé)解碼的是RNA聚合酶,它是一個蛋白,在DNA上面可以把雙螺旋打開,像一只手一樣把雙鏈結(jié)構(gòu)分開,分開之后單鏈就露出來了,然后RNA就會以單鏈序列為模板把信息抄寫到另一個分子——RNA分子上。RNA分子結(jié)構(gòu)和DNA很像,也是四個堿基,即AUGC,A對U,G對C,也就是說能根據(jù)DNA的堿基配對,把DNA序列原封不動的拷貝到RNA分子上,這個過程叫做轉(zhuǎn)錄。
單鏈RNA分子形成以后,會被從細(xì)胞核運到細(xì)胞質(zhì)里。之后更神奇了,有一個巨大的分子機(jī)器叫做核糖體,它就好像一個組裝機(jī)器的流水線,把RNA上面的四個字母以每三個字母搭配一種氨基酸(氨基酸是組成蛋白的基本材料,人體有20種常見的氨基酸)轉(zhuǎn)變?yōu)榘被嵝蛄校@個生產(chǎn)線過完之后就會形成一長串氨基酸鏈,這個鏈經(jīng)過折疊后就變成了蛋白。不同的三個字母搭配不同的氨基酸會組成不同的蛋白,而蛋白是大多數(shù)生命的細(xì)胞里最重要的活性大分子。所以蛋白的組成在很大程度上的決定了你的細(xì)胞是什么樣子,每個物種是什么樣子。
我和我的團(tuán)隊感興趣的是如果超越四個堿基和雙鏈結(jié)構(gòu)呢?能不能是五個或者六個字母呢?能不能是三鏈結(jié)構(gòu)呢?那會生成什么樣的蛋白質(zhì)呢?會產(chǎn)生什么樣的結(jié)果呢?在告訴大家方法論前,我先來講講我這樣做的動機(jī)。
動機(jī)分兩種,概念性動機(jī)和實用性動機(jī)。從有人以來,人們就開始思考,生命是什么?生命由什么組成?分子嗎?如果是,那是什么分子?對于這個問題,人們有不同的解讀。有人說生命和分子已經(jīng)如此完美,它們是造物主存在的證據(jù)。上帝將生命注入物質(zhì),注入到分子中,這樣分子才得以在生命中發(fā)揮作用。有些人則和達(dá)爾文站在一起,認(rèn)為生命是進(jìn)化得來的。不過不論你同意哪種觀點,有一點是可以確定的,那就是自然造物已經(jīng)如此完美,而經(jīng)歷過數(shù)十億年的進(jìn)化,大自然已經(jīng)沒有多少空間留給化學(xué)家去造物了。那化學(xué)家還能做什么呢?
從實用角度看,從胰島素開始,蛋白質(zhì)藥物已經(jīng)顛覆了整個醫(yī)藥產(chǎn)業(yè)。如今蛋白質(zhì)治療劑的種類越來越多,它做了很多小分子藥物做不了的事情。我們是不是可以這方面入手開發(fā)出新的蛋白或者蛋白藥物呢?
如果你對此感興趣,就必須設(shè)法做出我提到的第五個和第六個字母,這樣才可以在生物體中編碼出和常見的二十個氨基酸不一樣的氨基酸。自然系統(tǒng)的工作方法,正如我提到的G配對C、A配對T,它是通過共享氫原子來實現(xiàn),科學(xué)家稱之為氫鍵。因此G具有粘附于C的氫鍵模式,A具有與T互補的氫鍵模式。現(xiàn)在,為了搭配出第五和第六個人工的字母對,來形成第三對人工堿基對,科學(xué)家借助了核苷酸。我們必須考慮應(yīng)當(dāng)嘗試?yán)檬裁礃拥淖饔昧?。在自然界中有很多種作用力,我們不必非要使用自然界賴以用于信息和存儲和檢索的那個作用力。
事實上,有一種強大的作用力稱為疏水作用力。它被認(rèn)為是控制早期蛋白質(zhì)折疊過程的主要作用力。舉例說明,如果你把水和油混合起來,它們會互相逃避,不會混在一起。因此,如果我們制作疏水性的核苷酸類似物,像油一樣它們不會和類似水一樣的堿基配對,但它們可能會相互配對。所以我們可以使用這種作用力,因為它和大自然所用的作用力不一樣。那么我們是否可以利用疏水作用或其他堆積作用力來實現(xiàn)遺傳信息的穩(wěn)定儲存和檢索呢?這就是最初的想法。所以我的實驗室開始沿著這個方向探索。我是個化學(xué)家,我們從藥物化學(xué)的角度思考問題。我們試著用化學(xué)藥物開發(fā)的方法制造類似物。
大家從下圖可以看到一部分堿基,它是雙鏈螺旋字母的一部分。你們可以看到結(jié)構(gòu),雙鏈之間的梯子,這些通常相是會互相作用的部分。里面還有一些額外的糖和形成寡核苷酸或DNA的磷酸鹽,這里就不詳細(xì)描述了。我們設(shè)計的所有類似物都是疏水性的,它們被設(shè)計成用疏水作用力彼此配對,而非互補氫鍵作用。然后我們開始嘗試制造這些類似物。
就像我上面說的,我們用的是藥物化學(xué)的方法。我們首先嘗試的是制作一些簡單的堿基對,把它們放入DNA,看看細(xì)胞中的DNA聚合酶在復(fù)制DNA信息的時候能否能識別它們,以此分析這些人造堿基對的能力。剛開始的時候,我們只能在試管里做實驗,因為早期的堿基表現(xiàn)欠佳。它們幾乎無法被DNA聚合酶識別。我們瞪大眼睛仔細(xì)看,但看不到任何被識別的跡象。后來我們發(fā)現(xiàn)了一些稍微活躍一點的堿基,我們把它們收集起來,仔細(xì)觀察它們有什么不同之處。據(jù)此我們開始混合、匹配并組合差異,提升它們的多樣性。這是醫(yī)藥化學(xué)研究化學(xué)藥物的方法。
他們建立了所謂的結(jié)構(gòu)活性關(guān)系,以了解分子設(shè)計中的特定變化如何影響其行為。一旦構(gòu)建這些關(guān)系,你就可以用這些關(guān)系設(shè)計其他類似物以繼續(xù)完成該過程。所以我們篩選了很多類似物。這些類似物,現(xiàn)在在實驗室中被稱為“第一代類似物”。你可以看到它們都相當(dāng)?shù)拇螅S著我們越做越好,我們開始探索一些更小的(如下圖)。這些,現(xiàn)在在實驗室中被我們稱為“第二代類似物”。你看,我們正在探索很多不同類型的東西。我們正在研究不同的氟、處于不同位置的氟原子,或這種取代基,這是甲基中的氧或僅僅是簡單的甲基,許多不同大小的環(huán)。
第一代類似物
第二代類似物
經(jīng)過不停探索,大約14年后終于找到了一對,我們稱之為dNaM-dTPT3。我在這里展示它在DNA里的樣子,也正好可以再次向大家展示維持天然堿基對的氫鍵。
這是堿基A和T及令他們粘在一起形成雙鏈的互補氫鍵。如我所說,它也是能夠被復(fù)制和信息最終以蛋白質(zhì)形式表達(dá)的能力基礎(chǔ)。這里有兩個A-T對。這是我們的堿基對(灰色部分)。我們的沒有額外的氫鍵,但它們卻能抱在一起。首先我認(rèn)為這是一個非常有概念意義的結(jié)果。如果觀察自然形成的DNA雙鏈體,你會發(fā)現(xiàn),那些互補的氫鍵是它們中最明顯的部分,并且每個人都認(rèn)為它們是DNA必不可少的。而我們告訴大家,也許任何你可以駕馭的作用力,任何你作為化學(xué)家可以理解和研究的作用力,你都可以調(diào)配,并用來儲存和表達(dá)信息。所以我們開始重復(fù)利用這種疏水作用力。
我們很想在活體細(xì)胞內(nèi)嘗試這一發(fā)現(xiàn)。但在此之前,我想先告訴大家一些關(guān)于我們研究機(jī)制的細(xì)節(jié),因為我認(rèn)為這個故事非常精彩,是我最喜歡的實驗室故事之一。開發(fā)出這些人工堿基對后,我們假設(shè)即使沒有氫鍵,它看起來也會很像天然堿基對。大家都認(rèn)為聚合酶的能力是復(fù)制DNA序列信息然后將其轉(zhuǎn)移到蛋白質(zhì)中。每個聚合酶會識別特定的天然堿基對,也就是GC或AT。事實上,這對堿基被稱為沃森-克里克堿基對。可能大家都聽說過,它是化學(xué)領(lǐng)域最著名的結(jié)構(gòu)之一。因此,在圣地亞哥大學(xué)的最后階段,我們解出了雙鏈DNA中非天然堿基對的結(jié)構(gòu)。下圖里有十個不同結(jié)構(gòu),這是十個不同結(jié)構(gòu)的疊加,這里是平均結(jié)構(gòu)。
大家從上圖中可以看到,這些美麗的堿基對從上到下地排列在DNA里。中間這個是我們的,看起來不像天然堿基對。我把這個堿基放大,就是這個交互的部分允許它們配對。這是一個GC堿基對,G通過氫鍵和C配對。無論是CG還是GC,TA或AT都無關(guān)緊要。所有這些堿基對形成完全相同的結(jié)構(gòu)。無論是在雙鏈DNA或者在合成堿基對的過程中,它們總是形成相同的結(jié)構(gòu)。我們的人工堿基對的配對方式就完全不一樣??茖W(xué)家稱之為嵌插作用。
讓我們用藥物研發(fā)的思維來看這個問題。假設(shè)你發(fā)現(xiàn)了一種可以殺死細(xì)菌的分子,然后你拿去找輝瑞或諾華,讓他們把它做成藥。他們會問你:“它的靶標(biāo)是什么?作用機(jī)制是什么?”如果你的回答是:“誰在乎呢!我已經(jīng)證明它有活性了?!蹦撬幤笫裁粗С侄疾粫o你。因為醫(yī)藥研發(fā)花費巨大,藥物研發(fā)有嚴(yán)格流程,你想得到資金支持,必須弄明白你的分子的靶標(biāo)和作用機(jī)制。
所以在這里概念是類似的。我們已知DNA聚合酶可識別看起來像這樣的東西,我們的小東西看起來不像這樣(如上圖)。事實上,我們的家伙看起來像一個大自然的錯配。眾所周知,DNA聚合酶已經(jīng)進(jìn)化為拒絕自然錯配,所以我們在這里必須做些偽裝。我們希望研究復(fù)制過程中的結(jié)構(gòu)。我和康斯坦斯大學(xué)的朋友安迪·馬克斯(Andreas Marx)合作,我們得到了各種各樣的結(jié)構(gòu)。
為了說明這一點,我必須先簡要地講講DNA聚合酶是如何工作的。它負(fù)責(zé)復(fù)制DNA。它看起來像一只右手。 在酶里面你正在復(fù)制的DNA模板就像這樣待在里面。當(dāng)你把正確的單體加入到正在生長的DNA中的時,它會使酶的指狀結(jié)構(gòu)域落在酶的手掌和拇指區(qū)域上,形成非常緊密的封閉復(fù)合物。它就像一個拳頭,有選擇地非常具體地識別我說的那些沃森-克里克堿基對。我們的任務(wù)是找到任何類似這樣的東西,這就要思考兩件事。
第一個是我們的堿基對的結(jié)構(gòu)要足夠強大,以驅(qū)動聚合酶中同樣大的構(gòu)象變化。
第二個是個問題,聚合酶到底在識別什么?如此緊密復(fù)雜的識別是什么?因為我們的堿基對看起來完全不像沃森-克里克堿基對,它看起來像是一個應(yīng)該被拒絕的錯誤配對。我們和安迪一起開發(fā)了一些結(jié)構(gòu),我只會向大家展示一些重要的部分。這是二元復(fù)合物,二元意味著它由兩個部分組成。在這種情況下,它由正在合成的DNA和合成它的聚合酶組成。所以還沒有三磷酸鹽、也沒有單體被添加到正在增長的DNA中。這是我展示的唯一的聚合酶部分,它被稱為O和O 1螺旋,它是我提到的那個手指域的基礎(chǔ)。而這里是我們的小家伙從開發(fā)的螺旋中跳出來,無所適從。
現(xiàn)在這個是在科學(xué)中被稱為三元復(fù)合物的,因為它由三個部分組成,分別是:DNA模板、聚合酶和添加到DNA生長鏈中的單體。 可以看到我們的單體進(jìn)入我們的人工堿基,你可以看到它去結(jié)合的模板現(xiàn)在已經(jīng)轉(zhuǎn)變?yōu)檎诎l(fā)展的雙鏈體,進(jìn)入不斷增長的DNA鏈。在聚合酶中也獲得了大的構(gòu)象變化。這里是這個結(jié)構(gòu)的輪廓,在這兒大家可以看到構(gòu)象的變化。
現(xiàn)在為了說明它與由天然堿基對形成引起的構(gòu)象變化完全相同,這里是三元結(jié)構(gòu),它正在合成我們的天然堿基對,另一個在合成GC堿基對。所以你看,它們的結(jié)構(gòu)即使在側(cè)鏈的水平上也是絕對重疊,這一部分突出的蛋白質(zhì)肉眼可見也是重疊的。甚至催化所需的水和催化相關(guān)的鎂離子也是重疊的。
所以非天然堿基對的形成驅(qū)動了從開放到閉合聚合酶復(fù)合物的幾乎相同構(gòu)象變化。
現(xiàn)在我們來思考:它識別的到底是什么?
因為我們的配對并不像沃森-克里克堿基對。人工堿基確實形成了沃森-克里克形式的結(jié)構(gòu),但只發(fā)生在必要的在復(fù)制過程中。因此,科學(xué)家們討論出一種機(jī)制,通過該機(jī)制,天然堿基對合成為所謂的誘導(dǎo)契合機(jī)制。它的形成驅(qū)動了聚合酶的這種大的構(gòu)象變化。人工的堿基對不會被各種各樣奇怪的機(jī)制復(fù)制,它只是通過相同機(jī)制的微妙變異來復(fù)制。它的結(jié)構(gòu)驅(qū)動聚合酶的大的構(gòu)象變化,但聚合酶的大的構(gòu)象變化會驅(qū)動堿基對的相互構(gòu)象變化。選擇疏水效應(yīng)可能是我們最幸運的事,因為疏水效應(yīng)很強,但它不是很有方向性,它能夠按照必要的方式移動。并且它足夠靈活,可以從聚合酶中獲取方向以形成正確的結(jié)構(gòu),這樣它就可以合成。
我們花了15年的時間優(yōu)化這其中的化學(xué)合成工作?,F(xiàn)在我們已經(jīng)有了一個可以很好地復(fù)制的堿基對,可以被聚合酶很好地識別,我們可以用人工堿基對制造大量含有它的DNA,它們能非常好地保留高特異性和高效率。因此,我們有了向長期目標(biāo)發(fā)起進(jìn)攻的信心,我們已經(jīng)掌握了讓其在鮮活組織中工作的系統(tǒng)能力,再回到開始的那個問題:我們能否靠擴(kuò)展基因字母表,使活細(xì)胞、活生命體可以做更多事情?為了做到這一點,首先要思考的是我們要使用什么樣的生命體。我們選擇了大腸桿菌,因為操作大腸桿菌的工具最為先進(jìn)。
我們面對的第一個挑戰(zhàn)是如何把我們的人造核苷酸的三磷酸鹽,也就是那兩個新的字母,放進(jìn)細(xì)胞里?經(jīng)過大約六個月的工作,我們注意到有一種不太相干的生物體,一種藻類,它利用核苷三磷酸轉(zhuǎn)運蛋白,在雙層脂質(zhì)膜間運輸這些相同類型的單體。這種運輸工具的功能是將這些單體從膜的一側(cè)取出并傳遞到另一側(cè)。我們就想,如果把這些蛋白植入大腸桿菌,它們是否可以把我們的單體加入到細(xì)菌生長的培養(yǎng)基中,并把它們帶到細(xì)菌內(nèi)部,這樣它就可以使用它們了。在這里我用這些小孔來顯示它們。
結(jié)果非常好,我們的起始材料得以進(jìn)入活細(xì)胞。接下來的問題是:細(xì)胞會怎么對它們?如果我們給細(xì)胞一塊含有人造堿基對的DNA,它能復(fù)制并隨之生長嗎?我們花了14或15年的時間才做到這一點,而我已經(jīng)準(zhǔn)備好再花14到15年來讓它在大腸桿菌中工作。結(jié)果只用了大約三個星期。自從地球上所有生命的最后一個共同祖先以來,地球上所有生命一直用四個字母、兩對堿基對,每一個生物都是如此。而這些含有6個字母,即三對人工堿基的大腸桿菌細(xì)胞正在生長、分裂。這太令人興奮了!
既然我們可以將DNA存儲在這些活細(xì)胞中,我們能使用它嗎?我們能讓這些細(xì)胞用超過20種簡單的氨基酸來制造蛋白質(zhì),或者用我們挑選出的氨基酸,以便能夠制造出更多樣化的蛋白質(zhì)。所以我必須告訴你一些關(guān)于它工作方式的更多細(xì)節(jié)。
現(xiàn)在轉(zhuǎn)運蛋白dXTP和dYTP只是DNA復(fù)制的起始材料。XTP和YTP是你要生產(chǎn)的單體的起始材料,這些單體用于復(fù)制DNA。它們會被用于將DNA轉(zhuǎn)移到RNA中。你必須制作兩片RNA,一種代表信息的mRNA和一種代表轉(zhuǎn)移的tRNA。在這兩種分子起作用的方式是它們進(jìn)入細(xì)胞的核糖體,mRNA排成列,mRNA具有編碼蛋白質(zhì)的DNA序列,然后tRNA進(jìn)入并引入氨基酸。在這種情況下,它會引入不同于普通天然氨基酸的人工氨基酸。而且我們不會用含有新序列中的人工堿基對來編碼人工氨基酸。所以我們就想看看我們是否能夠表達(dá)蛋白質(zhì)。我們?nèi)ツ昴甑装l(fā)表了一篇論文,闡明了我們能夠合成蛋白質(zhì)。
讓我簡要介紹一下細(xì)節(jié)。我在這里展示下蛋白質(zhì)的產(chǎn)生,它恰好是一種熒光蛋白質(zhì),所以你可以看到熒光產(chǎn)生了多少蛋白質(zhì)。這是一個自然的序列,我們在這里生產(chǎn)了幾種不同的蛋白質(zhì),它們的生產(chǎn)非常有效率。如果你不添加所有必要的成分,你得到的蛋白質(zhì)會很少。這個凝膠很復(fù)雜,但是如果你集中在這最后一條通路,這就是如果你沒有所有必需品的情況,而如果你都有,那就會看到轉(zhuǎn)變。因此,我們加入的人工氨基酸有一個小標(biāo)簽,可以讓我們在上面附加?xùn)|西,這就是我們判斷人工氨基酸存在的辦法。在這種情況下,我們附著的是一個熒光基團(tuán),它只是一個發(fā)光的分子,所以它被叫做TAMRA。
所以當(dāng)你附上它時,你會看到一條帶子。這就是所謂的電凝膠,一種電泳凝膠。你會看到蛋白質(zhì)通過凝膠遷移并形成一條帶的過程。你看,這條帶子是紅色的因為它上面有熒光基團(tuán),就是說它含有人工氨基酸。你們看一下質(zhì)譜數(shù)據(jù)就知道這個蛋白質(zhì)純度非常高。這是一個自然控制,這是兩個自然控制,它們是非常純凈的,而這些是我們的。我們確實受到了一些污染。請注意,突破就在這里,所以這些是10%到90%,這是低到2%,立竿見影,我們的污染全部小于2%。這已經(jīng)和通過其他方法引入人工氨基酸的標(biāo)準(zhǔn)一樣好了。這是一個小細(xì)節(jié),但我想強調(diào)一下,因為它很重要。
引入的人工氨基酸對應(yīng)在復(fù)制過程中丟失的DNA序列。所以錯誤不是在蛋白質(zhì)生產(chǎn)過程中出現(xiàn)的,而是DNA在保留人工堿基對時出現(xiàn)的,這確實是最困難的一步。我想說的重點是,我們已經(jīng)在實驗室中開發(fā)了一種方法,可以提高保留率,將DNA的保真度提高幾個數(shù)量級。 它們沒有出現(xiàn)在這里,因為在這些早期的研究中,我們想要表明的是,如果不使用自然編碼所用的單一氫鍵作用,我們也可以使用完全不同的作用力來編碼信息。因此,不僅我們的字母是新的,而且它們配對的方式、它們使用作用力的方式,都與自然完全不同。
這回到了我之前提到過的關(guān)于生命分子的概念問題:生命的分子有多特別?他們有什么特權(quán)?這些數(shù)據(jù)表明也許生命的分子并不那么特別,也許化學(xué)家可以理解和培養(yǎng)的許多不同種類的分子、不同的作用力,都是合適的。
我們成立了一家生物技術(shù)公司,該公司正將這個技術(shù)商業(yè)化,生產(chǎn)用于治療特定疾病的蛋白質(zhì)。這是我演講想展示的最后一個部分。我們稱之為SSO,即半合成生命體(semi-synthetic organism)。這是他們成長和分裂的實際情況。自從最后一個共同的祖先以來,地球上的所有生命都被四個字母、兩對堿基對、以及20個天然氨基酸編碼而成。而這些正在成長的細(xì)胞是有著六個字母、三個堿基對,以及它們在這種情況下是用21個氨基酸來制造蛋白質(zhì)。
我的演講就到這里,謝謝大家。
本文經(jīng)公眾號“未來論壇(ID:futureforum)”授權(quán)轉(zhuǎn)載
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點或證實其描述。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn