文 丨 新浪科技 周文猛

當前,隨着ChatGPT、大模型等AI技術的湧現和飛速發展,使得生物醫學大數據的研究更接近產業化和臨牀應用的需求,比如AlphaFold技術的發展,使得越來越多的傳統藥企擁抱AI智能。然而這一過程中,智能技術與生物醫學的結合仍面臨着諸多挑戰,比如數據隱私保護和倫理政策限制、數據分散導致的小數據等。

2023中國計算機大會前夕,新浪科技《科創100人》採訪了北京理工大學醫學技術學院長聘教授、中國計算機學會生物信息學專委會祕書長張法,交流了大模型與生物醫藥結合的限制與挑戰、產業現狀及人才需求等問題。

對話中,張法指出:“作爲一門交叉學科,當前生物計算產業各方面仍比較新,與實際業務的結合仍比較遠。”而這個過程中,“交叉人才的稀缺”及“行業數據孤島”的存在,仍是制約着生物計算行業發展的核心難題。

“即使是同一個醫院中的不同分院,目前他們彼此間的數據,也是沒有實現互通。各自把數據當作無價之寶,事實上如果這些數據沒有互通,那將無法發揮它的價值。”張法表示。他呼籲生物醫藥行業採取更開放的方式來進行數據的交流。

在張法看來,從企業和商業角度來看,當前業界討論比較多的“大模型+醫療”結合,更多地可能是一個噱頭。這背後,大數據纔是支撐起整個生物醫藥和人工智能技術發展的關鍵,希望大家慎重考慮在“大模型+醫療”方面的佈局。

(張法 北京理工大學醫學技術學院長聘教授,中科院計算所客座研究員、博士生導師 現任中國計算機學會生物信息學專委會祕書長)

“醫療行業數據‘孤島’林立”

作爲一門高度交叉的前沿科技領域,生物信息學的一端是生物醫藥,另一端是信息科技,兩端都是門檻極高的領域,且彼此間差異極高。這讓能夠真正在這一領域做到拔尖的人員比較稀少,而人才的稀少,又直接限制了行業的發展。近些年,隨着計算機算力、人工智能等技術的飛速發展,以及華大製造等國內領域內企業的長期努力,業界對於生物信息尤其生物計算領域的印象初步改觀。

張法指出,生物信息主要是通過計算手段解決生物或醫學問題,在這個過程中,我們需要將有機生物或醫學應用於計算,過程中不僅僅需要信息技術人員,還需要生物醫學領域專家、企業策劃、產品推廣等高層次交叉人才,只有這些人員共同參與,纔可能促使這一領域真正落地。

以醫學大數據分析處理爲例,經常有很多醫生會詢問是否能處理特定醫學數據,但懂數據分析的人員往往並不知道該如何從醫學角度處理這些數據,因爲他們缺乏明確的處理目標,需要有專門的生物學家來描繪清楚目標問題。此外,即使醫學人員描繪清楚了問題,如何通過物理數據分析出具體的病情?輔助醫療人員作出判斷,仍面臨着諸多專業認知的壁壘。

交叉跨度大導致的認知差、人才不足外,行業數據的過度保護和限制流通,也正制約着這一領域的發展。張法指出,在生物醫學領域,由於大部分生物數據主要用於科研研究,國家層面對相關數據也制定了一定的上傳備份策略,因此,這一領域的數據獲取相對容易。但在醫學領域,數據的壁壘卻非常高,目前這些數據基本上沒有實現互通。

“即使是同一個醫院,數據本來就是同一個單位的,只是分不同醫院。但即使如此,他們的數據也沒有實現互通,他們各自把數據當做無價之寶,事實上如果這些數據沒有互通,無法實現真正的交流,這些數據是無法發揮價值的。”張法表示。

在張法看來,從生物或醫學家的角度來看,他們認爲所有數據都有價值。但從計算角度來看,“我們認爲只有標註過的數據纔有價值”。近些年很多人也希望通過區塊鏈、聯邦學習等技術來解決或督導醫學私有數據公權化,但目前看來這樣的方法還沒有解決根本問題。

“生物或醫學方面可能需要採取更開放的方式進行一些數據的交流共享;此外,從國家層面或合作層面也需要儘快制定一些標準,以儘可能保障醫生應有的權利和利益。”張法表示。

“需慎重佈局‘大模型+醫療’”

今年以來,伴隨着ChatGPT的迅速走紅,國內快速出現了一批“大模型+醫療”的解決方案。對外提供藥品問答、醫考知識、診療建議等能力。

在張法看來,從企業和商業角度來看,“大模型+醫療”的提法,本質上還是以大數據作爲最後的支撐,大家在參與這一領域佈局時需要慎重考慮。

“ChatGPT背後依靠的實際上還是大模型和大數據,因爲沒有大量數據和大模型,訓練根本無從談起。因此,我認爲大模型與醫療的結合實際上還是之前的方式,只不過是重新加入了一些最新的人工智能或深度學習技術,形成了一個模型。但實際上,所有深度學習都需要構建這個模型。”

“三四年前深度學習剛出現時,深度學習對圖像處理的效果非常好,後來發現醫學圖像和AI領域,僅北京就出現了超5000多家公司,然而現在回頭看,這裏面接近90%的公司都已經消失了。”張法表示。

“大模型和大數據確實能推動醫學發展,但還需要交叉領域的人才,能夠抓住核心問題,洞察到商機,這纔是最關鍵的。”張法表示。在他看來,“在生物和計算領域,最關鍵的並非計算,因爲計算機起到輔助作用,在前期最主要的是對生物問題的感悟和把握。”

在生物醫藥領域,如今基於AI製藥的很多藥企已經開始使用這些技術。在輔助診斷領域,我們現在研判肺部x光片的也正在藉助AI來進行輔助診斷。此外,在生物學領域,人工智能在多模態生物醫學數據分析領域也正發揮着越來越多的作用。“這兩年大家逐漸認識到,針對生物問題,必須有計算領域的人才介入。目前,這種交叉學科已經在這個領域有所發展,不再像過去那樣封閉,生物領域的人們對我們計算出來的東西也會拿來作爲依據了。”張法表示。

張法預測,未來3-5年,人工智能的紅利還能持續發展,人工智能在生物醫藥方面的作用將越來越大。

2023中國計算機大會介紹:

19個特邀報告,3場大會論壇,學術界、企業界大咖悉數到場。2023中國計算機大會(CNCC2023)大會日程已基本確定,特邀報告及大會論壇主題全公佈,趕快報名加入,與來自前沿科研與應用領域的院士、資深專家和企業精英一起,思考未來計算技術發展趨勢。

相關文章