歡迎關注“新浪科技”的微信訂閱號:techsina 

文/李開復

來源:李開復(ID:kaifu)

在我的新書中,我和科幻作家陳楸帆創造性合作,暢想了 20 年後在人工智能等科技影響下的人類世界。

書中的 10 個短篇故事,展示了一系列的未來場景 —— 身臨其境的沉浸式娛樂方式、自如使用人類語言的虛擬伴侶、 沒有“司機”的完全自動駕駛汽車、能夠以假亂真的照片和視頻,以及基於量子計算、計算機視覺和其他 AI 技術的展開應用……

在故事《無接觸之戀》發生的時代,人類社會已經被疫情徹底改變——直到最後,新冠病毒(COVID-19)也沒有被徹底消滅,相反,它進化成了一種長期存在的、不斷變異的季節性病毒。

這當然只是一種虛構的情境。然而,在經歷了一次新冠肺炎疫情之後,不論這種病毒今後會如何變異,可以確定的是,AI 將重塑整個醫療行業,例如加快疫苗和相關藥物的研發,加速 AI 診斷與現有醫療手段進行技術集成的進程,等等。

那麼,新冠病毒如何推動這些技術的發展?

我們現在對人工智能醫療的關注尤其及時,因爲醫療行業正在數字化,而這將產生人工智能顛覆醫療所需的大量數據。2042 年當我們回顧,我們可能會看到過去20年醫療領域是AI顛覆最大的行業。

傳統藥物及疫苗研發

長期以來,藥物及疫苗的研發都是一件極其耗時、成本高昂的工作。想象一下,人類用了 100 多年時間,才完成了腦膜炎疫苗的研製和改進。而在這次新冠肺炎疫情中,正是因爲各國政府把史無前例的鉅額資金投入多條研發賽道,支撐了大量的臨牀試驗和量產嘗試,醫藥企業的疫苗研發才推進得如此迅速。

在等待了一年之後,我們終於用上了安全有效的新冠疫苗。好在新冠病毒的致死率沒有那麼高,這樣的等待才顯得可以接受。然而,如果新冠病毒進化成一種像埃博拉一樣致命的傳染病,情況就會變得完全不同。因此,考慮到未來可能出現新的傳染病,疫苗和藥物的研發速度仍然需要繼續提高。

研發藥物時,第一步先要理解病毒蛋白質(氨基酸序列)是如何摺疊成獨特的 3D 結構的。理解這種 3D 結構,對解讀病毒的工作原理並找到對抗它的方法至關重要。例如,就像鑰匙插入鎖孔中一樣,新冠病毒表面的刺突蛋白可以附着在人體細胞表面的受體上。當新冠病毒侵入人體細胞後,新冠病毒基因組(新冠病毒的 RNA)將被傳遞、整合到宿主細胞上,然後在許多器官中不斷複製,從而導致感染者表現出一系列的症狀。

針對某種病原體的小分子藥物發明,是通過將治療分子附着在病原體上來抑制其功能而起作用。這種治療分子的發現過程可以分爲以下四個步驟:

第一步,利用 mRNA 序列推導病原體的蛋白質序列(現在這一步不難實現);

第二步,探索該蛋白質序列的三維結構(蛋白質摺疊方式);

第三步,確定三維結構上的靶點;

第四步,生成可能有效的靶向分子,然後從中選擇最佳臨牀前候選藥物。

如果回到之前用過的類比,那麼第一、二、三步相當於摸清鎖的結構,第四步相當於打造一把適配的鑰匙。這四個步驟需要依次完成,後三個步驟的工作不僅非常耗時,而且成本高昂。

例如第二步,爲了確定病毒蛋白質序列的三維結構,科學家會使用冷凍電子顯微鏡成像等技術,直接觀察病毒蛋白,然後一步一步艱苦地摸索、推敲出 3D 蛋白質結構。

第三、第四步是找到靶點並設計出對應的靶向藥物,這是一個漫長的試錯之旅,而且需要科學傢俱備強烈的直覺、豐富的經驗和好運氣。不過,就算科學家耗費數年時間鎖定了一種臨牀前候選藥物,它也有 90% 的概率無法通過二期、三期臨牀試驗。這個探索過程會耗費相當長的時間。當然,也可以並行探索幾種不同的方法,不過這樣雖然可以縮短時間,但需要大量的資金投入。

AI 在蛋白質摺疊、藥物篩選及研發方面的潛力

目前,要研發一種有效的藥物或疫苗,需要投入 10 億 ― 20 億美元的資金和數年的研發時間。我相信,AI 將大幅提升藥物的研發速度,降低研發成本,爲患者提供更多價格在可承受範圍內的特效藥,幫助患者活得更健康、更長壽。

2020 年,DeepMind 公司針對蛋白質摺疊研究(藥物研發的第二步),推出了蛋白質摺疊預測軟件 AlphaFold,可以說,這是迄今爲止 AI 在科學領域最偉大的成就。

蛋白質是生命的基石,但對於人類來說,蛋白質的氨基酸序列如何摺疊成 3D 結構,從而成爲生命活動功能執行者的整個過程,仍是一個謎。解開這個謎,不僅具有重大的科學意義,對醫學領域也有極高的價值。恰巧,深度學習技術似乎非常適合在這個問題上“大展拳腳”。

AlphaFold 背後的訓練數據集非常龐大,包含了過去發現的所有蛋白質三維結構信息。目前,AlphaFold 已經證明了它模擬未知蛋白質三維結構的能力,其準確性與傳統方法(如上面提到的冷凍電子顯微鏡成像技術)不相上下。區別在於,傳統方法成本高、耗時長,而且只能解析所有蛋白質結構中不到 0.1% 的部分;AlphaFold 的出現,提供了一種快速擴大人類已知蛋白質數量的方法,被視爲“解決了困擾生物學界 50 年之久的巨大挑戰”,是一項劃時代的突破。

一旦掌握了蛋白質的三維結構,“藥物再利用”就成了一種能夠幫科學家快速找到有效治療手段的方法,即嘗試每一種已經證明對一些小病安全、有效的現有藥物,看看其中哪些藥物可能成功嵌入當前病毒的蛋白質三維結構。

“藥物再利用”方法有可能成爲一條捷徑,從而使人類能夠在一場嚴重的流行病發生之初就阻止病毒的傳播。因爲這些能被“再利用”的藥物均已通過不良反應測試,可以直接使用,無須再經過大範圍臨牀試驗。《無接觸之戀》中的男主角加西亞在被檢測出攜帶 COVID-Ar-41 的變體病毒後,臨牀中心就立即啓動了 AI 程序,以“再利用”一種能夠減輕他的症狀的藥物。

科學家還可以充分利用AI的優勢,發明新的化合物。AI 可以鎖定一些靶向分子可能附着的靶點(藥物研發的第三步)。如果給定一個靶點,AI模型就可以通過識別數據的內部模式,來縮小對藥物的搜索及篩選範圍,鎖定候選藥物(藥物研發的第四步)。2021 年,AI 藥物研發公司英矽智能宣佈其利用 AI 完成了治療特發性肺纖維化的新藥研發,先在三維結構上找到靶點(第三步),然後提取相關信息並找到最佳的靶點分子(第四步)。英矽智能的AI技術不僅爲藥物研發的後兩個步驟節省了 90% 的成本,還創造了一項不可思議的奇蹟:用 18 個月的時間完成了新藥研發。要知道,傳統新藥研發往往要耗時 10 年以上,耗資超過 20 億美元。

此外,AI 還可以整合多方面知識來優化第三、四步研發過程。例如,自然語言處理(NLP)技術可對海量學術論文、專利成果和公開數據進行深入挖掘,從中提取出能夠幫助鎖定靶點或有效分子排序的信息。AI 還可以根據過去的臨牀試驗結果,預測所有潛在候選新藥的有效性,爲進一步排序提供參考。這些,都可以在計算機系統上模擬完成。科學家可以站在 AI 的肩膀上,參考系統給出的推斷,排除“錯誤選項”,然後再進行下一步研究。

當然,除利用計算機模擬進行研究的“幹實驗”外,還有一種“溼實驗”,即在實驗室培養皿中對人體細胞展開藥物測試。對於這一類實驗,AI 同樣有很大的施展空間。在今天,由機器人來主導這類實驗,會比由實驗室技術員來操作更加高效,而且可以採集到更多的數據。鎂伽機器人就是這樣的先進公司,鎂伽的實驗室機器人,無須人工干預,就能進行 24 小時全天候的重複實驗,這將大大加快藥物的研發速度。

相關文章