美國時間 11 月 30 日,谷歌母公司 Alphabet 旗下人工智能公司 DeepMind 公開宣佈,生物學界 50 年來的重大難題——蛋白質摺疊預測,已被其成功攻克。Alphabet 旗下人工智能公司 DeepMind 在預測蛋白質結構方面邁出了一大步。

該公司的最新 AlphaFold 系統,在第 14 次 CASP 評估中的總體中位數得分達到了 92.4GDT。其中,GDT(Global Distance Test ) 是CASP 用來測量預測準確性的主要指標,其範圍是從0-100。

公司表示,其已經解決了關鍵的 “蛋白質摺疊問題”,並將解決問題的運算時間從數月縮短至數小時,這有助於加快藥物發現速度,有可能破解一個類似於繪製人類基因組的問題。

DeepMind 首席執行官傑米斯・哈薩比斯 (Demis Hassabis),是遊戲開發者、神經學家和人工智能企業家。他在電話採訪中表示:“這些算法現在已經足夠強大,強大到可以應用於解決科學問題。經過 4 年的發展,我們有了一個足夠精確的系統,對生物學研究人員來說具有實際的生物學意義和相關性。”

哈薩比斯表示,DeepMind 目前正在研究以 “可擴展方式” 爲科學家提供訪問 AlphaFold 系統的途徑。AI 與蛋白質

每個活細胞體內都有成千上萬種不同的蛋白質,蛋白質的不同摺疊程度決定了它如何與其他分子相互作用,瞭解蛋白質結構變化,對發現新冠肺炎等病毒如何侵入人體細胞、設計酶分解污染物、研究癌症和老年癡呆症以及提高作物產量具有重要意義。

歐洲生物信息學研究所的珍妮特・桑頓教授表示:“蛋白質是最美麗的結構。準確預測蛋白質的摺疊非常具有挑戰性,多年來一直困擾着很多人。”

從某種程度上來說,生命的本質其實就是 4 中不同鹼基的排列組合。包含整個生命密碼的 DNA,僅有 4 種鹼基組成,翻譯出 64 種密碼子,對應着整個地球生命系統中僅有的 20 多種氨基酸,之間排列組合,構成了數萬至數億種不同的蛋白質。

而真正決定不同蛋白質性質和功能的,除了不同氨基酸的排列組合,更重要的是氨基酸鏈的 3D 結構,已經採用了包括 X 射線晶體學、核磁共振、冷凍電鏡等技術來解析蛋白質結構。

理論上來說,知道了 DNA 序列,就已經決定了其能夠翻譯出的氨基酸序列和蛋白質結構,但想要實現這種預測,中間涉及的計算難度難以想象。

近年來,隨着基因測序技術和AI的發展,使通過氨基酸序列來預測蛋白質結構成爲可能。征戰 CASP

全球蛋白質結構預測競賽(Critical Assessment of protein Structure Prediction,CASP),由美國科學家約翰・莫爾特(John Moult)於 1994 年發起,每兩年舉辦一屆,旨在吸引計算機科學、生物物理學等不同領域的專家參與到蛋白質三維結構預測這一極具挑戰性的生物信息學問題中來,共同評估發展現狀和討論未來的趨勢。

CASP 在過去 25 年中一直在關注這個領域的進展,該組織的評價方式是將參賽者提供的解決方案與 “黃金試驗標準” 進行對比。

DeepMind 開發的 AlphaFold 系統在最近結構預測關鍵評估(CASP)競賽中所展現出的能力達到了 “解決” 問題的水平。

本週一,該組織表示,DeepMind 的 AlphaFold 系統在蛋白質結構預測方面表現出了無與倫比的準確性。

早在 2018 年第 13 屆全球蛋白質結構預測競賽 CASP 上,DeepMind 的最新人工智能程序 AlphaFold ,成功預測生命基本分子 —— 蛋白質的三維結構 。當時,首次參賽的 AlphaFold 在 98 名參賽隊伍中排名第一,其預測的 43 種蛋白質中有 25 種蛋白質的結構最準確,而排名第二的團隊中只有 3 種。

AlphaFold 負責人約翰・姜普(John Jumper)認爲,要想產出 “真正具有生物學相關性,或在實驗上有競爭力” 的成果,還有一段路要走。

現在,參與 CASP 的科學家們分析了大約 100 種蛋白質的氨基酸序列形狀。參賽者被告知排列順序,並負責預測蛋白質的形狀。AlphaFold 對其中三分之二蛋白質結構的評估與 CASP 的分析幾乎完全一致,而其他團隊的評估契合度約爲 10%。

今年的比賽對 DeepMind 來說也並非一帆風順。姜普表示,DeepMind 在 3 個月時間裏毫無進展。“我們坐在那裏,擔心是否已經耗盡了數據。” 即使比賽結束日期臨近,姜普及其團隊也還在擔心,他們可能出了錯。他說:“機器學習系統總是會出各種錯誤。”

不過,他們的努力已經獲得了回報。姜普表示:“我們真的認爲,我們開發了一個系統,爲實驗生物學家提供正確、可操作的信息。你想要尋找這樣的結構是因爲,你想要去理解大自然,隨後去提出更多的問題。我們認爲,我們開發的系統已經可以真正幫助人們去做到這一點。”

CASP 主席約翰・墨爾特(John Moult)教授表示:“DeepMind 已經取得領先。計算機科學領域長達 50 年的重大挑戰在很大程度上已得到解決。對於藥物設計,以及蛋白質設計等新興領域,這都將產生重大影響。”

歐洲生物信息學研究所 (European Bioinformatics Institute) 名譽主任珍妮特・桑頓 (Janet Thornton) 說:“確定單個蛋白質結構通常需要多年的實驗努力。”

桑頓是使用計算方法分析蛋白質結構的先驅之一。“更好地理解蛋白質結構、能夠使用計算機預測它們意味着更好地理解生命進化歷程,當然,也能夠更好理解還有有關人類健康和疾病的諸多問題。”神奇的 DeepMind

谷歌 2014 年以 6 億美元的價格收購了 DeepMind。成爲谷歌子公司,目標是開發可以應用於更廣泛問題的人工智能。該公司一直表示,希望能在科學領域發揮更大的影響力。

2016 年,DeepMind 公司推出的 AI 圍棋程序 AlphaGo 橫空出世,以 4:1 的比分壓倒性的戰勝圍棋世界冠軍李世石,終結了人類職業棋手對圍棋的絕對話語權;2017 年 DeepMind 團隊再次推出 AlphaZero。它是一種可以從零開始,通過自我對弈強化學習在多種任務上達到超越人類水平的新算法;隨後加入家族戰隊的 AlphaFold,中文封號爲阿爾法摺疊。

DeepMind 大約有 1000 名員工,但幾乎沒有任何收入。谷歌母公司 Alphabet 爲支持該公司投入了鉅額成本。不過,DeepMind 已經與 Facebook 人工智能實驗室、微軟和 OpenAI 等實體一起,成爲了全球人工智能競賽的領先者之一。

谷歌 CEO 桑達爾・皮查伊(Sundar Pichai)在 Twitter 上爲此次突破點贊。DeepMind 聯合創始人及 CEO 德米斯・哈薩比斯(Demis Hassabis)則表示:“DeepMind 背後的終極願景一直是構建通用人工智能,利用通用人工智能來極大地加速科學發現的步伐,幫助我們更好地瞭解周圍世界。”

哈薩比斯說:“遊戲是很好的試驗平臺,有助於高效地開發和測試通用算法。但我們希望,未來某天這些算法能應用到現實世界,例如去解決科學問題。我們認爲,AlphaFold 是證明這個邏輯的第一步。這些算法現在正變得足夠成熟和強大,能夠應用於真正具有挑戰性的科學問題。”

相關文章