說起近兩年最熱門的話題,那一定非大模型莫屬了。衆所周知,伴隨着ChatGPT的強勢出圈,全球範圍內掀起了一波人工智能熱潮,國內外的諸多企業都開足馬力,推出了自己的大模型產品。而AI大模型產品的不斷問世,也上演了一番“百模大戰”的盛況。

隨着越來越多AI大模型產品的相繼推出,AI大模型的落地應用也逐漸提上了日程,成爲了各行各業的重點關注方向。值得注意的是,除了通用大模型之外,針對細分行業的垂直大模型數量也日漸增多,醫療場景更是受到各方關注的重點領域。事實上,自2023年以來,已經有諸多頭部企業都在加碼醫療大模型領域,而這也意味着大模型正在逐漸深入醫療行業。

大模型,醫療行業的新加速器?

近兩年,AI大模型的熱度居高不下,各行各業都在積極擁抱AI大模型,希望AI大模型能夠爲行業帶來新的變化,醫療行業也不例外。AI大模型這股風已然吹到了醫療行業,一系列與醫療相關的大模型產品和應用正在相繼湧現出來。

比如,京東健康正式發佈了面向醫療健康行業的大模型“京醫千詢”;百度正式發佈國內首個“產業級”醫療大模型“靈醫大模型”;醫聯正式發佈了自主研發的醫療大語言模型MedGPT;衛寧健康則是發佈了醫療領域大模型“WiNGPT”。在各路玩家相繼佈局醫療大模型背後,也自有其邏輯。

對企業來說,AI大模型的引入,有助於提升醫療效率,降低成本。AI大模型是深度學習模型,這也就意味着AI大模型具備很強的學習能力,能夠對海量數據進行分析和處理,並進行推理和預測。正因如此,醫療大模型能夠對醫療數據進行分析和整理,並根據醫療信息進行相應的診斷,輔助醫生進行診斷,而這可以在一定程度上促進醫護工作者醫療效率的提高。比如,醫療大模型就能夠將醫生口述轉化爲帶有對話語言的結構化筆記,極大地節省了醫生手寫病歷的時間,提升了工作效率。

對用戶來說,AI大模型產品的推出,有助於進一步提升患者的就診體驗,爲其提供全方位醫療服務。不同於其他需求,用戶的就醫需求是長期存在的,但受各類因素影響,患者往往面臨着多種難題,比如候診時間長、找不到相應科室等等,就醫過程中所遇到各種突發問題,也影響了患者的就醫體驗。而醫療大模型的出現,則有望解決患者在就醫過程中所遇到的痛點問題,爲患者帶去更加高效、優質的就醫體驗。比如,在診前環節,醫療大模型就能夠根據患者的就醫需求,爲其推薦相應的科室,解決了患者不知道該掛哪個科室的問題。

除此之外,AI大模型的出現與應用,也能夠在一定程度上助推醫療行業數字化轉型加速。衆所周知,數字化轉型早已成爲了各行業企業的重點發力方向之一,醫療行業也不例外。然而,不同於其他行業,醫療行業具備極大的特殊性和嚴肅性,再加上各地的基礎設施建設情況不同、新舊系統共存,醫療行業存在着明顯的“信息孤島”現象,而這也是醫療行業數字化轉型速度緩慢的重要原因所在。AI大模型在醫療領域擁有廣闊的應用場景,隨着AI大模型和醫療結合程度的加深,或將有助於推動醫療行業朝着更加數字化、智能化的方向發展。

百度、騰訊“水到渠成”

在這波AI大模型浪潮中,跑在最前面的無疑是互聯網大廠,以百度、阿里、騰訊爲代表的互聯網大廠都相繼推出了自家的AI大模型產品,比如,百度的“文心一言”大模型、阿里的“通義千問”大模型、騰訊的“混元”大模型。由於醫療行業被視爲AI大模型落地的最佳領域之一,醫療行業也掀起了一波大模型熱潮,許多互聯網大廠也推出了自己的醫療大模型產品。比如,百度發佈了“靈醫大模型”、騰訊則是推出了“騰訊醫療大模型”。而互聯網大廠之所以能夠率先推出面向醫療行業的大模型產品,與其長時間的積累不無關係。

一方面,百度、騰訊都已經推出了自研的通用大模型產品,有研發大模型產品的經驗,這些經驗能夠爲其專用的醫療大模型產品的推出提供借鑑和參考。長期以來,以百度、騰訊爲代表的互聯網大廠都格外關注人工智能領域,並且在該領域持續深耕,積累了深厚的技術實力,而這些都爲其推出AI大模型產品打下了堅實基礎,也助推了其垂直大模型產品的出現。

比如,百度、騰訊等互聯網大廠就在自研的通用大模型的基礎上,引入專業的醫學數據,對大模型進行訓練和微調,最終推出面向醫療行業的專用大模型產品。具體來看,騰訊的醫療大模型就是基於騰訊全鏈路自研混元大模型研發的;百度的“靈醫”大模型的技術底座同樣來自於此前的文心一言大模型。

另一方面,百度、騰訊等互聯網大廠在醫療健康領域有所佈局,有行業數據的積累。一直以來,互聯網大廠都在積極拓展業務版圖,其中醫療健康領域就是其重點佈局的領域之一。以百度爲例,百度不僅推出了深耕醫療領域的AI醫療品牌“靈醫智惠”,還打造了能夠提供健康科普、在線問診等服務的一站式健康管理平臺“百度健康”。

正因如此,百度、騰訊等互聯網大廠積累下來了大量醫療數據,這些數據積累使其推出專業的醫療大模型產品成爲可能。據瞭解,在模型訓練過程中,百度大健康事業羣(HCG)先後投入了自有積累的超1000萬優質醫療問答數據、超2000萬多語種醫學專業知識、超2億用戶每日醫療類搜索數據、超5億權威健康科普內容。無獨有偶,騰訊的醫療大模型加入了超過285萬醫療實體、1250萬醫學關係、超98%醫學知識的知識圖譜和醫學文獻。

微脈、衛寧健康“乘勢而起”

醫療大模型熱度正高,除了互聯網大廠頻頻佈局之外,自然也少不了本行業玩家的參與,互聯網醫療企業同樣是落子不斷。具體來看,全病程管理平臺微脈正式發佈了其自主研發的健康管理領域大語言模型應用——CareGPT;衛寧健康則是正式推出了醫療領域大模型——WiNGPT。在互聯網醫療企業積極擁抱AI大模型背後,也並非毫無緣由。

一來,微脈、衛寧健康擁有豐富的醫療行業經驗,以及海量的醫療數據,能爲其訓練醫療大模型奠定基礎。數據對於AI大模型的重要性可想而知,AI大模型的能力之所以能夠不斷進化和提升,離不開數據的支撐。尤其是對行業大模型來說,行業數據更是格外重要。而無論是微脈,還是衛寧健康,都長期深耕於醫療健康領域,有着專業的醫療知識庫。得益於此,微脈、衛寧健康都積累下來了海量的、高質量的醫療數據,這些數據無疑是大模型產品的優質訓練數據集,能夠幫助二者訓練出精準度更高、可靠性更強的醫療大模型產品。

據瞭解,微脈的CareGPT在訓練階段就以循證醫學爲基礎,使用了目前最新版本臨牀醫學指南、疾病診療模型、專家共識等超10億的醫學文本數據,以及百萬條微脈個案管理數據,形成專科專病管理的醫療健康知識庫,並投入超過100位個案管理師參與RLHF監督調試訓練。另一組數據顯示,在2023年5月,WiNGPT訓練的數據量已達到9720項藥品知識、7200餘項疾病知識、2800餘項檢查檢驗知識、1100餘份指南文檔,總訓練Token數達37億。

二來,微脈、衛寧健康的業務與醫療大模型有着天然的契合度,更容易實現醫療大模型的落地與應用,有望助推其業務的進一步發展。除了大模型產品的推出之外,後續的落地應用同樣是相當重要的一環。由於微脈、衛寧健康本身就是互聯網醫療企業,其業務開展也都圍繞着醫療健康方面,醫療大模型與其業務有着很高的契合度,更容易實現落地。

比如,CareGPT就能對患者聊天內容進行分析,可以幫助患者自主進行初步的身體狀況篩查,實現分診導診的智能化輔助,提升患者管理的效率。隨着醫療大模型產品能力的不斷進化,並且逐漸應用到具體場景中,醫療大模型也能夠爲互聯網醫療企業業務賦能,有望爲其帶來新的業務增長點。

醫療大模型這條路還很遠

得益於人工智能技術的蓬勃發展,以及相關技術在醫療場景的逐漸應用,AI醫療正在逐漸成爲現實,醫療大模型的出現更是有望爲醫療行業注入新的發展動力。當前,AI大模型浪潮席捲而來,無論是互聯網大廠,還是互聯網醫療企業,都不願意錯失這個機會,紛紛乘浪而上。只是,必須要說的是,醫療大模型雖蘊含着機遇,但同樣有着門檻。

一是,醫療大模型容錯率低,廠商們還需要不斷打磨產品。不同於其他行業,醫療行業有着很強的嚴肅性和專業性,可以說是不容有失,這也就意味着醫療大模型產品的容錯率極低,這就對廠商們提出了更高的要求。爲了避免此類情況的發生,發力於此的廠商們必須保持審慎的態度,不斷打磨產品本身,以提升大模型產品的能力。

二是,醫療數據的隱私性高、數據處理難度大,醫療大模型的訓練不易。衆所周知,由於醫療數據往往涉及患者本身,因此具備很高的私密性,但大模型能力的訓練又需要大量數據爲支撐,對研發醫療大模型的廠商來說,數據的獲得有着比較高的難度。不僅如此,由於數據標準不一,醫療行業的數據處理同樣難度較高,需要醫療大模型廠商多下功夫。

就目前情況來看,醫療大模型產品的誕生或許能夠爲醫療行業帶來發展新機遇,幫助企業降本增效、爲患者帶來更加優質的就醫體驗,但由於醫療大模型尚處於剛剛開始發展的階段,難關同樣有很多,需要廠商們去跨越。總而言之,醫療大模型產品的推出並不意味着結束,反而是新的起點,無論是互聯網大廠,還是互聯網醫療企業,都不能掉以輕心,這場競賽仍持續進行中。

本文來自微信公衆號“劉曠”(ID:liukuang110),作者:劉曠公衆號,36氪經授權發佈。

相關文章