11月20日上午消息,2021未来科学大奖周-科学峰会期间,芝加哥丰田计算技术研究所教授许锦波发表了《蛋白质结构预测和深度学习》的主题演讲,许锦波指出,深度学习技术已颠覆了蛋白质结构预测,90%的蛋白质都可以有正确的形状预测,而且蛋白以及蛋白之间的相互作用也能够得到不错预测。

细胞是构成生命体的基本单位,但在细胞中,蛋白质则又是构成细胞的重要生命物质,是生命活动的体现者和承担者,其中,蛋白质分子组成及其折叠结构在很大程度上决定了其所具备并正在发挥的生物学功能。在过去几十年间,人类对于蛋白质结构的研究及预测便已经正在开展,但是整体而言进展缓慢,同时也并不能完全准确地预测出蛋白质的结构及其功能。

据许锦波介绍,在2016年之前,人们对于超过150个氨基酸序列蛋白质的结构预测都比较困难,并且成功概率极低。在此之前,人们采用了大量的工具及方法对蛋白质分子结构进行预测,但往往收效甚微。

以深度学习为例,事实上,早在2016年之前,深度学习技术便已经被运用于蛋白质结构预测中,但当时机器学习面对挑战在于,在蛋白质结构预测过程中,传统的方法主要是通过局部氨基酸取样测算,然后再对蛋白质分子间关系及结构进行预测,但这种方式的结果不尽如人意,收效甚微。

在许锦波看来,这种传统的预测方式事实上并没有完全利用到整个蛋白质信息库里的内容,存在明显的局限性。因此,在2015-2016年间,许锦波团队改变了这一深度学习预测策略,采用全局式的结构预测方式,将图像处理中的图像分割技术迁移到蛋白质结构预测领域,采用深度学习卷积网络对蛋白质结构进行整体测算,并通过矩阵距离重构蛋白质分子间三维结构,进一步辅助开展蛋白质结构预测。

据许锦波介绍,目前该种方法已经能够完全预测人类80%以上的蛋白质结构,而且精确度仍在不断地提升。据许锦波介绍,后来他们的该种蛋白质结构预测思想得到了DeepMind团队的重视,并参与了进来。

据介绍,在今年DeepMind推出的AlphaFold2深度学习算法中,AlphaFold2对于蛋白质结构预测的核心思想中,便具有许锦波团队此前实现蛋白质结构预测的核心思想。

“深度学习技术被运用于生物蛋白结构预测的可行性已经得到验证,深度学习已经颠覆了蛋白质结构预测,目前80%的蛋白质都可以有正确的形状预测,并且实现这些预测的速度已经非常快了,蛋白质之间的相互作用也能够被很好地验证到了。”许锦波表示。(文猛)

相关文章