DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

ADVERTISEMENT

生物學家花了50年都解不出的難題,突然就被AI解決了?

美國時間11月30日,DeepMind宣佈推出AlphaFold,這是一種能夠基於蛋白質的基因序列,利用AI預測蛋白質3D結構的系統。

在國際蛋白質3D結構預測競賽(CASP)上,AlphaFold系統在第14次CASP評估中的總體中位數得分達到92.4GDT,擊敗了其餘的參會選手。GDT(Global Distance Test ) 是CASP用來測量預測準確性的主要指標,範圍是從0-100。

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

DeepMind表示,他們已經解決了關鍵的「蛋白質摺疊問題」,並且將解決問題的運算時間從數月縮短至了數小時,這將大大加速藥物發現速度,有可能破解一個類似於繪製人類基因組的問題。

DeepMind首席執行長Demis Hassabis在電話採訪中表示:「這些演算法現在已經足夠強大,強大到可以應用於解決科學問題。經過4年的發展,我們有了一個足夠精確的系統,對生物學研究人員來說具有實際的生物學意義和相關性。」

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

Hassabis還透露道,DeepMind目前正在研究以「可擴展方式」為科學家提供連結AlphaFold系統的途徑。

DeepMind的這一成就不僅引來不少業界人士的點讚,Nature還發文稱,「這將改變一切」。

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

此前,DeepMind在西洋棋、圍棋、遊戲星海爭霸II和老式的Atari經典遊戲中,都戰勝了人類玩家,這次,他們更是直接向學術圈發起了挑戰。

論預測蛋白質結構的不可能

我們都知道,在每個活細胞內部有著成千上萬種不同的蛋白質,蛋白質的不同摺疊程度決定了它的獨特功能。因此,如果我們能夠預測蛋白質的結構變化,這對於人類攻克癌症等疑難雜症有著劃時代的意義。

但是,要準確預測蛋白質的摺疊,在過去50年間一直困擾著生物學家。

這就要從蛋白質的生成說起了。以DNA生物為例,DNA由4種鹼基組成,這4種鹼基能夠透過轉錄和翻譯生成64種密碼子,這64種密碼子又對應著20多種氨基酸,氨基酸之間的排列組合,構成了數萬至數億種不同的蛋白質。但是,決定蛋白質不同功能的,除了氨基酸的種類數量外,氨基酸的3D結構起著更為重要的作用。

從理論上來說,如果我們知道了DNA序列,就能夠繪製出氨基酸序列和蛋白質結構,但如果想要實現這種預測,中間涉及的計算難度難以想像。

早在1969年,Cyrus Levinthal就指出,如果我們使用蠻力計算的方式,每舉每一種蛋白質可能存在的結構,那麼我們要花費的時間甚至比宇宙的年齡還要長。Levinthal估計,一種蛋白質大約存在10*300種結構,但在自然界中,蛋白質會自發摺疊,有些只需幾毫秒。

AlphaFold如何將不可能變為可能

2018年,DeepMind團隊就已經用初始版AlphaFold參加了CASP13比賽,當時他們也取得了最高的準確率,隨後,DeepMind還把CASP13方法和相關程式碼發表在了Nature上。

如今,DeepMind團隊利用新的深度學習架構繼續參賽CASP14,也刷新了自己的記錄,準確率達到了92.4GDT。

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

DeepMind團隊使用的數據也都是公開數據,包括蛋白質結構數據庫(PDB)和包含未知結構蛋白質序列的大型數據庫,共約170,000個蛋白質結構。運行週期持續了數週,主要使用了約128個TPUv3內核運行。

正如上文所說,如果我們把蛋白質的3D結構視為一張空間圖,用節點表示殘基,邊將殘基緊密連接起來,要理解這種結構,DeepMind團隊創建了一個基於注意力的神經網絡系統,用端到端的方式進行訓練,並且基於構建的隱式圖執行推理。

通過迭代這一過程,該系統能夠較強地預測蛋白質的底層物理結構,並在幾天內確定高度準確的結構。此外,AlphaFold還能使用內部置信度度量指標判斷預測的每個蛋白質結構中哪一部分比較可靠。

DeepMind精準預測蛋白質結構,AI解決50年生物學難題!

AlphaFold負責人John Jumper認為,要想產出「真正具有生物學相關性,或在實驗上有競爭力」的成果,還有一段路要走。

CASP主席John Moult教授表示:「DeepMind已經取得領先。生物學長達50年的難題在很大程度上已得到解決。對於藥物設計以及蛋白質設計等新興領域,這都將產生重大影響。」

DeepMind團隊表示,他們準備在適當的時候將AlphaFold新系統相關論文提交至同行評審期刊。

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則