文 丨 新浪科技 周文猛

当前,随着ChatGPT、大模型等AI技术的涌现和飞速发展,使得生物医学大数据的研究更接近产业化和临床应用的需求,比如AlphaFold技术的发展,使得越来越多的传统药企拥抱AI智能。然而这一过程中,智能技术与生物医学的结合仍面临着诸多挑战,比如数据隐私保护和伦理政策限制、数据分散导致的小数据等。

2023中国计算机大会前夕,新浪科技《科创100人》采访了北京理工大学医学技术学院长聘教授、中国计算机学会生物信息学专委会秘书长张法,交流了大模型与生物医药结合的限制与挑战、产业现状及人才需求等问题。

对话中,张法指出:“作为一门交叉学科,当前生物计算产业各方面仍比较新,与实际业务的结合仍比较远。”而这个过程中,“交叉人才的稀缺”及“行业数据孤岛”的存在,仍是制约着生物计算行业发展的核心难题。

“即使是同一个医院中的不同分院,目前他们彼此间的数据,也是没有实现互通。各自把数据当作无价之宝,事实上如果这些数据没有互通,那将无法发挥它的价值。”张法表示。他呼吁生物医药行业采取更开放的方式来进行数据的交流。

在张法看来,从企业和商业角度来看,当前业界讨论比较多的“大模型+医疗”结合,更多地可能是一个噱头。这背后,大数据才是支撑起整个生物医药和人工智能技术发展的关键,希望大家慎重考虑在“大模型+医疗”方面的布局。

(张法 北京理工大学医学技术学院长聘教授,中科院计算所客座研究员、博士生导师 现任中国计算机学会生物信息学专委会秘书长)

“医疗行业数据‘孤岛’林立”

作为一门高度交叉的前沿科技领域,生物信息学的一端是生物医药,另一端是信息科技,两端都是门槛极高的领域,且彼此间差异极高。这让能够真正在这一领域做到拔尖的人员比较稀少,而人才的稀少,又直接限制了行业的发展。近些年,随着计算机算力、人工智能等技术的飞速发展,以及华大制造等国内领域内企业的长期努力,业界对于生物信息尤其生物计算领域的印象初步改观。

张法指出,生物信息主要是通过计算手段解决生物或医学问题,在这个过程中,我们需要将有机生物或医学应用于计算,过程中不仅仅需要信息技术人员,还需要生物医学领域专家、企业策划、产品推广等高层次交叉人才,只有这些人员共同参与,才可能促使这一领域真正落地。

以医学大数据分析处理为例,经常有很多医生会询问是否能处理特定医学数据,但懂数据分析的人员往往并不知道该如何从医学角度处理这些数据,因为他们缺乏明确的处理目标,需要有专门的生物学家来描绘清楚目标问题。此外,即使医学人员描绘清楚了问题,如何通过物理数据分析出具体的病情?辅助医疗人员作出判断,仍面临着诸多专业认知的壁垒。

交叉跨度大导致的认知差、人才不足外,行业数据的过度保护和限制流通,也正制约着这一领域的发展。张法指出,在生物医学领域,由于大部分生物数据主要用于科研研究,国家层面对相关数据也制定了一定的上传备份策略,因此,这一领域的数据获取相对容易。但在医学领域,数据的壁垒却非常高,目前这些数据基本上没有实现互通。

“即使是同一个医院,数据本来就是同一个单位的,只是分不同医院。但即使如此,他们的数据也没有实现互通,他们各自把数据当做无价之宝,事实上如果这些数据没有互通,无法实现真正的交流,这些数据是无法发挥价值的。”张法表示。

在张法看来,从生物或医学家的角度来看,他们认为所有数据都有价值。但从计算角度来看,“我们认为只有标注过的数据才有价值”。近些年很多人也希望通过区块链、联邦学习等技术来解决或督导医学私有数据公权化,但目前看来这样的方法还没有解决根本问题。

“生物或医学方面可能需要采取更开放的方式进行一些数据的交流共享;此外,从国家层面或合作层面也需要尽快制定一些标准,以尽可能保障医生应有的权利和利益。”张法表示。

“需慎重布局‘大模型+医疗’”

今年以来,伴随着ChatGPT的迅速走红,国内快速出现了一批“大模型+医疗”的解决方案。对外提供药品问答、医考知识、诊疗建议等能力。

在张法看来,从企业和商业角度来看,“大模型+医疗”的提法,本质上还是以大数据作为最后的支撑,大家在参与这一领域布局时需要慎重考虑。

“ChatGPT背后依靠的实际上还是大模型和大数据,因为没有大量数据和大模型,训练根本无从谈起。因此,我认为大模型与医疗的结合实际上还是之前的方式,只不过是重新加入了一些最新的人工智能或深度学习技术,形成了一个模型。但实际上,所有深度学习都需要构建这个模型。”

“三四年前深度学习刚出现时,深度学习对图像处理的效果非常好,后来发现医学图像和AI领域,仅北京就出现了超5000多家公司,然而现在回头看,这里面接近90%的公司都已经消失了。”张法表示。

“大模型和大数据确实能推动医学发展,但还需要交叉领域的人才,能够抓住核心问题,洞察到商机,这才是最关键的。”张法表示。在他看来,“在生物和计算领域,最关键的并非计算,因为计算机起到辅助作用,在前期最主要的是对生物问题的感悟和把握。”

在生物医药领域,如今基于AI制药的很多药企已经开始使用这些技术。在辅助诊断领域,我们现在研判肺部x光片的也正在借助AI来进行辅助诊断。此外,在生物学领域,人工智能在多模态生物医学数据分析领域也正发挥着越来越多的作用。“这两年大家逐渐认识到,针对生物问题,必须有计算领域的人才介入。目前,这种交叉学科已经在这个领域有所发展,不再像过去那样封闭,生物领域的人们对我们计算出来的东西也会拿来作为依据了。”张法表示。

张法预测,未来3-5年,人工智能的红利还能持续发展,人工智能在生物医药方面的作用将越来越大。

2023中国计算机大会介绍:

19个特邀报告,3场大会论坛,学术界、企业界大咖悉数到场。2023中国计算机大会(CNCC2023)大会日程已基本确定,特邀报告及大会论坛主题全公布,赶快报名加入,与来自前沿科研与应用领域的院士、资深专家和企业精英一起,思考未来计算技术发展趋势。

相关文章