數(shù)據(jù)是人工智能(AI)藥物發(fā)現(xiàn)的基礎。AI對高質(zhì)量大數(shù)據(jù)的需求,或?qū)⑼苿铀幬锇l(fā)現(xiàn)數(shù)據(jù)的自動化和規(guī)?;伞?/span>
生物醫(yī)學數(shù)據(jù)存在可重復性“危機”
有70%的科學家表示他們無法復制另一位科學家的實驗,超過一半的科學家表示他們無法復制自己的實驗。這是2016年5月英國《自然》雜志(Nature)對1576名研究人員進行問卷調(diào)查得出的結(jié)果。數(shù)據(jù)顯示,52%的受訪者同意存在嚴重的可重復性“危機”。根據(jù)拜耳和安進公司的統(tǒng)計,生命科學已發(fā)表的研究成果中,多達89%的研究結(jié)果無法復制。甚至出現(xiàn)當研究結(jié)果無法重復時,研究人員通常會認為這種情況是完全合理的現(xiàn)象。
在生物醫(yī)藥行業(yè),包括數(shù)據(jù)可重復性在內(nèi)的數(shù)據(jù)質(zhì)量問題一直存在。而AI在藥物研發(fā)中的探索和應用實踐,讓這一問題更加明顯。
數(shù)據(jù)是AI藥物發(fā)現(xiàn)的基礎。如果所使用的數(shù)據(jù)可重復性較差,質(zhì)量參差不齊,那便意味著由此產(chǎn)生的學習模型并不可靠。
一些AI藥物發(fā)現(xiàn)初創(chuàng)公司開始意識到,要充分發(fā)揮AI的價值,除了從公開來源、合作伙伴等渠道獲得數(shù)據(jù)以外,還應該尋找新的數(shù)據(jù)來源,比如自建實驗室獲取數(shù)據(jù)(如Exscientia),或?qū)ⅰ皾駥嶒灐辈糠滞獍o合同研究組織(CRO)來獲得相對精準的數(shù)據(jù)。
還有一些公司獨辟蹊徑,借助遠程機器人來提高數(shù)據(jù)質(zhì)量。Insilico Medicine與Arctoris的合作便是典型案例。2020年7月,Insilico Medicine宣布與Arctoris建立技術(shù)合作伙伴關(guān)系,前者利用其AI技術(shù)發(fā)現(xiàn)新穎的小分子化合物,后者則在其機器人平臺上評估小分子化合物預期的生物活性。
遠程機器人實驗室或更有優(yōu)勢
相比于自建實驗室,AI藥物發(fā)現(xiàn)公司將“濕實驗”的部分外包給專業(yè)的CRO或許更為合理,因為成本更低。而相對于傳統(tǒng)的CRO,遠程機器人實驗室在未來或許更有優(yōu)勢。
首先,數(shù)據(jù)可重復性方面具有優(yōu)勢。在生命科學領域,目前大多數(shù)工作流程都是手動完成,數(shù)據(jù)捕獲方式很不確定;即便如今已經(jīng)進入自動化時代,但大多數(shù)生物學家仍在依靠手工進行移液操作。傳統(tǒng)的實驗室用人工執(zhí)行工作流程,不僅效率低下,而且操作標準不統(tǒng)一,影響數(shù)據(jù)可靠性的主觀因素較多。機器人實驗室可以簡化實驗室儀器和設備,讓硬件和軟件無縫結(jié)合在一起工作,讓科學家能夠獲得可重復性更高的實驗結(jié)果。而且,在數(shù)據(jù)收集階段機器人就能獲得干凈的、可用于AI訓練的數(shù)據(jù)。
其次,效率優(yōu)勢明顯。2020年7月,《自然》雜志封面報道了利物浦大學研究人員開發(fā)的一款“AI化學家”機器人。這款機器人可以在標準實驗室中像人類一樣使用各種實驗儀器,自主完成一系列實驗操作。在第一次測試中,“AI化學家”機器人在8天時間里獨立完成668個實驗,研發(fā)出一種全新的化學催化劑,并且每天工作21.5個小時,剩下的時間用于暫停充電。這款機器人可以稱量固體、分配液體、從容器中除去空氣、操作催化反應和定量反應產(chǎn)物,從某種意義上來說,它就是機器人研究員。
再次,機器人可以采集更全面的數(shù)據(jù)并進行實時分析。與人類不同的是,機器人具有無限的耐心,可以同時考慮數(shù)十個甚至更多維度變量的數(shù)據(jù)。這些數(shù)據(jù)不僅包括實驗數(shù)據(jù)、設備數(shù)據(jù),還包括環(huán)境條件和設備狀態(tài)數(shù)據(jù)。然后,從實驗室產(chǎn)生的數(shù)據(jù)被匯總和分析,提供給研究人員。
最后,遠程機器人實驗室還意味著科學家與實驗室可以解綁??蒲腥藛T并不一定需要擁有自己的實驗室,或者必須在實驗室工作。他們可以在任何地方設計化合物,然后讓機器人合成該化合物,并執(zhí)行后續(xù)的活性驗證步驟。實驗結(jié)束后,研究人員可以在全球任何地方下載結(jié)果數(shù)據(jù)。同時,機器人實驗室提高了科學儀器設備的使用率,也為沒有資金購買昂貴設備的小型公司和個人打開了藥物發(fā)現(xiàn)的新世界。
遠程機器人實驗室逐漸興起
當一些新生事物或新技術(shù)出現(xiàn)以后,把它們連接起來,就會產(chǎn)生很多新的可能。
應用于AI藥物發(fā)現(xiàn)的遠程機器人實驗室包含四大關(guān)鍵技術(shù):AI技術(shù)、機器人技術(shù)、物聯(lián)網(wǎng)、云計算。AI技術(shù)用來生成新的分子或形成假設,然后交由機器人執(zhí)行驗證操作或?qū)嶒灧桨?,物?lián)網(wǎng)技術(shù)用于獲得關(guān)于實驗的多維度實時信息;來自實驗室設備、環(huán)境、各種傳感器的信息被匯總交由AI學習,進入下一個生成-驗證循環(huán)周期進行快速迭代;云計算讓藥物發(fā)現(xiàn)的遠程部署成為現(xiàn)實。于是,藥物發(fā)現(xiàn)的設計、執(zhí)行、反饋、處理形成閉環(huán)。
在全球范圍內(nèi),遠程機器人實驗室正在逐漸興起。
2020年8月底,IBM發(fā)布了一個運行在云端的新化學實驗室RoboRXN,該實驗室可以幫助科學家遠程設計和合成新分子。
科學家可以通過網(wǎng)絡瀏覽器在線登錄該實驗室平臺,畫出他們想要合成的分子化合物的框架結(jié)構(gòu),然后該平臺使用機器學習來預測所需的化學反應和反應順序,并將指令發(fā)送給遠程實驗室里的機器人去執(zhí)行。實驗完成之后,平臺會將結(jié)果報告發(fā)送給科學家。
目前,一些遠程機器人實驗室公司已經(jīng)成立并獲得投資。
Arctoris
Arctoris成立于2016年,位于英國,是市場上第一家提供全自動藥物發(fā)現(xiàn)平臺的公司,可由機器人完成各種生化、細胞生物學和分子生物學測定,學術(shù)機構(gòu)和生物技術(shù)公司能夠遠程實時監(jiān)控實驗。
Culture Biosciences
Culture Biosciences成立于2016年,位于美國舊金山。其特色在于設計了一套遠程實時監(jiān)控的生物反應器,加上廣泛的菌種篩選和工藝開發(fā)能力,無論是小型生物技術(shù)公司還是大型制藥企業(yè),都可以在其平臺上快速實現(xiàn)從實驗室規(guī)模轉(zhuǎn)入商業(yè)化生產(chǎn)。
Emerald
Emerald成立于2010年。與Strateos不同,Emerald并沒有提供一套事先定義的工作流程,而是提供了廣泛的科學儀器設備,因此能夠設計出完全可定制的生命科學實驗。Emerald不斷增加新的操作方法和設備類型,為客戶提供廣泛而靈活的服務。
Kebotix
Kebotix成立于2017年,總部位于美國波士頓,專注于應用機器人技術(shù)和AI建模來開發(fā)具有目標性質(zhì)的新化合物。該公司可以通過自動化機械臂的使用,大大減少每次操作的時間,同時也能夠通過應用機器學習工具預測實驗結(jié)果,為實際實驗選擇最優(yōu)路線,減少實驗次數(shù)。
Strateos
Strateos成立于2012年,位于美國加州,倡導“按需自動發(fā)現(xiàn)”,通過創(chuàng)建程序化的實驗室環(huán)境(SCLE)來協(xié)調(diào)科學流程、儀器和機器人,使發(fā)現(xiàn)過程成規(guī)模、高效、準確。2020年,Strateos開始與禮來合作,使用Strateos機器人云平臺來提高生物學能力,實現(xiàn)自動化的化學合成循環(huán)。
Synthace
Synthace成立于2011年,總部位于英國。Synthace推出基于云的自動化平臺Antha,使研究人員能夠使用圖形界面規(guī)劃和設計實驗,無需具備特定的編碼技能。Antha允許用戶建立復雜的協(xié)議,并在多個設備之間傳輸。在實驗開始之前,Synthace就可以通過模擬程序來識別接下來工作流程中潛在的問題。
未來,或許只需要一臺筆記本電腦、一個好的想法以及使用遠程機器人實驗室,在咖啡廳就可以開始或進行藥物發(fā)現(xiàn)。在這種情況下,實驗室正在變成數(shù)據(jù)生成工廠,生物醫(yī)學一定程度上被作為信息科學來研究??茖W家將從大量的重復性工作中解放出來,有更多的時間來思考科學假設,集中精力投入到創(chuàng)造性工作當中。
科學發(fā)現(xiàn)的工業(yè)化時代在路上。AI對高質(zhì)量大數(shù)據(jù)的需求,將推動藥物發(fā)現(xiàn)數(shù)據(jù)的自動化和規(guī)?;?。同時,大量高質(zhì)量數(shù)據(jù)的產(chǎn)生,會進一步加快數(shù)據(jù)驅(qū)動的藥物發(fā)現(xiàn)。
中國醫(yī)藥報 06版 研發(fā)智藥
作者:侯小龍
作者單位:上海邦越醫(yī)藥科技有限公司
聲明:化學加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn