交汇点讯 看完恐怖片后好几天不敢一个人上厕所;握不到你的手,却能感受到你的温柔……人们时常在脑海中“自嗨”,对漫画中、小说中以及现实中自己希望而没有发生的情节进行幻想,这也正是我们常说的“脑补”。“后续剧情请大家自行脑补”,在社交平台上,我们常常能够看见这样的评论。然而,大脑如何自动补充那些实际并没有出现的信息?人工智能是否也可以拥有“脑补”这一神奇“技能”呢?《科技周刊》记者近日采访相关专家,为大家揭秘关于“脑补”的那些事。

图片来源:视觉中国

“脑补”如何实现?

还记得当时在网络上非常著名的“裙子是蓝黑还是白金”的争论吗?南京市第一医院心理门诊牟晓冬博士表示,这其实正是一种典型的“脑补”结果:“脑补”不光取决于外在的信息,也取决于大脑对于外界信息的加工。这种直觉式的、联想式的信息加工,就被称为“脑补”。

那么,“脑补”是如何实现的呢?当代最具影响力的心理学家之一丹尼尔·卡尼曼在其著作《思考,快与慢》提出,我们的大脑有“快”与“慢”两种作决定的方式。常用的、无意识的“系统1”依赖情感、记忆和经验迅速作出判断;而有意识的“系统2”通过调动注意力来分析和解决问题,并作出决定。牟晓冬解释:“系统1的信息加工方式是联想式、直觉式的,这也意味着人在看到某一事物后,可以很快对其进行处理;而系统2则基于规则和逻辑分析判断,因此相较于系统1要慢一些。日常生活中,人们会同时运用这两种模式进行思考。”

系统1和系统2相互协作,使人们做出更理性的决定,但当处理复杂信息的时候,由于没有足够的信息量,人们往往只能利用系统1进行快速“脑补”,即凭自己既往的经验,靠直觉得出结论。牟晓冬表示:“在认知心理学上,我们将系统1的信息加工模式称为‘基模’,也就是说,既往的经验、人有意或无意学习到的知识,都会以类似于模版的形式存储在人的记忆中,随时等待被激活。”

牟晓冬补充,我们常说“仁者见仁,智者见智”,面对同一事物,不同身份的人“脑补”出来的内容可能截然不同。换句话说,这种“脑补”不可避免的带有一些个人倾向性,虽然在没有足够多线索的时候,此方式能节省时间帮助人迅速做决定,但也常常容易出错。“人的所有判断都有主观的加工,心理状态也会影响自己的感觉。心情好的时候常常会觉得自己更好看一些,‘脑补’的内容也常常会被当下心理活动所影响。”

人工智能也能“脑补”吗?

根据部分信息自动补全内容,这种神奇的信息加工处理方式是否可以应用于人工智能的开发设计?“脑补”算法的设计难点在哪里?为此,《科技周刊》记者采访省人工智能学会专家、南京航空航天大学人工智能学院张道强副院长,他表示,目前主要有三种方法可以让人工智能实现“脑补”。第一种方式是,利用机器学习方法通过根据局部纹理特征填补周围区域,即使用类似纹理的补丁,以coarse-to-fine(由粗略到精细)的方式“脑补”其余内容。“这是一种局部的方法。当然,我们还可以利用大型数据库,以数据驱动的方式进行‘脑补’,即通过数据库查询与被查询对象相似度较高的样本,并根据相似度较高的样本对被查询对象进行信息补全。”

此外,人工智能深度学习中的神经网络也可以用于实现“脑补”功能。张道强介绍,例如早期的联想记忆神经网络方法,以编码-解码的方式利用部分信息“脑补”出整个物体。近年来,生成对抗网络(GAN)因为其强大的生成能力在机器学习领域得到了人们的广泛关注,而它也被应用于“脑补”算法中。“生成对抗网络由一个生成器和判别器构成,生成器用来进行‘脑补’,而判别器则通过‘脑补’内容和真实内容的对抗不断改进生成器的‘脑补’能力。”张道强解释。

想要让人工智能也具备类似人类的强大“脑补”功能,前期需要哪些筹备工作呢?张道强表示,首先需要收集大量的数据。“机器学习,包括近年来十分火热的深度学习,都需要从数据中学习其中蕴含的规律。而要想学习到数据的分布规律,就必须要依靠大量的数据样本。”其次,对于不同任务,我们需要根据任务的特点设计不同的先验知识,通常在先验知识的支持下模型能够获得更好的自动补全结果。

正如人在“脑补”时常会出现错误,“脑补”算法也不可避免会出现错误。张道强认为,“脑补”算法的难点首先在于数据。机器学习、深度学习模型是一种数据驱动的模型,通常需要“看见”数据,才能够“脑补”数据。无论是通过数据库查询方式还是对抗生成网络方式(GAN),都需要大量的数据作为依赖。当数据量不够大时,机器就会“脑补”出错误内容,而这也是一个机器学习、深度学习方法的重要难点问题之一。此外,缺失部分的多少也会影响到“脑补”的结果。“数据的缺失量决定了数据样本本身提供的信息量,因此如果缺失信息过多,很难对样本进行补全。”张道强表示,机器学习目前主要是以数据驱动的方式,对于未知数据的推测也是目前的研究重点之一。

“脑补”算法如何走进生活?

尽管人工智能“脑补”算法听起来有些复杂难懂,但实际上,生活中相关的应用有很多。例如,算法常常会根据用户的行为对用户进行画像,进而为用户推荐其可能喜欢的内容;日常生活中,人们常会使用软件去除图片上的马赛克,或者借助软件将模糊不清的旧照片恢复清晰等。“去除图像中的马赛克,以及从低分辨率到高分辨率图像的重建,实际上是通过机器学习方法实现‘脑补’。而在这些方面,人工智能‘脑补’都取得了不错的准确率。”张道强告诉《科技周刊》记者,为了进一步真实模拟人类“脑补”功能,近年来,他带领团队尝试通过“脑解码”的方式来探究大脑在感知周围环境时真实的神经响应模式。通过对人脑神经活动进行分析,团队利用机器学习算法来进行建模,从而解码环境中的相关视觉刺激。

“这种‘解码’,实际上包含了刺激标签预测和刺激图像重建两种不同的方式。”张道强解释,具体来说,标签预测是指判断当前所受的到底是哪种刺激,比如看到的是猫?是人?还是其他物体?而图像重建则是利用机器学习的回归算法来对刺激进行重构,从而更加形象地对感知到的物体进行展示。“通过我们正在研究的‘脑解码’来探寻人脑活动模式和对应刺激之间的关系,除了能够从大脑活动模式出发去解码相关刺激之外,其实还可以反向通过刺激来重建大脑的活动模式,从而挖掘神经科学相关的信息,例如被试者的脑功能是否正常等,应用前景广阔。”张道强说。

新华日报·交汇点记者 谢诗涵 蒋明睿

相关文章