新知 | 信息不够，何以“脑补”出完整“世界”

交汇点讯看完恐怖片后好几天不敢一个人上厕所；握不到你的手，却能感受到你的温柔……人们时常在脑海中“自嗨”，对漫画中、小说中以及现实中自己希望而没有发生的情节进行幻想，这也正是我们常说的“脑补”。“后续剧情请大家自行脑补”，在社交平台上，我们常常能够看见这样的评论。然而，大脑如何自动补充那些实际并没有出现的信息？人工智能是否也可以拥有“脑补”这一神奇“技能”呢？《科技周刊》记者近日采访相关专家，为大家揭秘关于“脑补”的那些事。

图片来源：视觉中国

“脑补”如何实现？

还记得当时在网络上非常著名的“裙子是蓝黑还是白金”的争论吗？南京市第一医院心理门诊牟晓冬博士表示，这其实正是一种典型的“脑补”结果：“脑补”不光取决于外在的信息，也取决于大脑对于外界信息的加工。这种直觉式的、联想式的信息加工，就被称为“脑补”。

那么，“脑补”是如何实现的呢？当代最具影响力的心理学家之一丹尼尔·卡尼曼在其著作《思考，快与慢》提出，我们的大脑有“快”与“慢”两种作决定的方式。常用的、无意识的“系统1”依赖情感、记忆和经验迅速作出判断；而有意识的“系统2”通过调动注意力来分析和解决问题，并作出决定。牟晓冬解释：“系统1的信息加工方式是联想式、直觉式的，这也意味着人在看到某一事物后，可以很快对其进行处理；而系统2则基于规则和逻辑分析判断，因此相较于系统1要慢一些。日常生活中，人们会同时运用这两种模式进行思考。”

系统1和系统2相互协作，使人们做出更理性的决定，但当处理复杂信息的时候，由于没有足够的信息量，人们往往只能利用系统1进行快速“脑补”，即凭自己既往的经验，靠直觉得出结论。牟晓冬表示：“在认知心理学上，我们将系统1的信息加工模式称为‘基模’，也就是说，既往的经验、人有意或无意学习到的知识，都会以类似于模版的形式存储在人的记忆中，随时等待被激活。”

牟晓冬补充，我们常说“仁者见仁，智者见智”，面对同一事物，不同身份的人“脑补”出来的内容可能截然不同。换句话说，这种“脑补”不可避免的带有一些个人倾向性，虽然在没有足够多线索的时候，此方式能节省时间帮助人迅速做决定，但也常常容易出错。“人的所有判断都有主观的加工，心理状态也会影响自己的感觉。心情好的时候常常会觉得自己更好看一些，‘脑补’的内容也常常会被当下心理活动所影响。”

人工智能也能“脑补”吗？

根据部分信息自动补全内容，这种神奇的信息加工处理方式是否可以应用于人工智能的开发设计？“脑补”算法的设计难点在哪里？为此，《科技周刊》记者采访省人工智能学会专家、南京航空航天大学人工智能学院张道强副院长，他表示，目前主要有三种方法可以让人工智能实现“脑补”。第一种方式是，利用机器学习方法通过根据局部纹理特征填补周围区域，即使用类似纹理的补丁，以coarse-to-fine（由粗略到精细）的方式“脑补”其余内容。“这是一种局部的方法。当然，我们还可以利用大型数据库，以数据驱动的方式进行‘脑补’，即通过数据库查询与被查询对象相似度较高的样本，并根据相似度较高的样本对被查询对象进行信息补全。”

此外，人工智能深度学习中的神经网络也可以用于实现“脑补”功能。张道强介绍，例如早期的联想记忆神经网络方法，以编码-解码的方式利用部分信息“脑补”出整个物体。近年来，生成对抗网络（GAN）因为其强大的生成能力在机器学习领域得到了人们的广泛关注，而它也被应用于“脑补”算法中。“生成对抗网络由一个生成器和判别器构成，生成器用来进行‘脑补’，而判别器则通过‘脑补’内容和真实内容的对抗不断改进生成器的‘脑补’能力。”张道强解释。

想要让人工智能也具备类似人类的强大“脑补”功能，前期需要哪些筹备工作呢？张道强表示，首先需要收集大量的数据。“机器学习，包括近年来十分火热的深度学习，都需要从数据中学习其中蕴含的规律。而要想学习到数据的分布规律，就必须要依靠大量的数据样本。”其次，对于不同任务，我们需要根据任务的特点设计不同的先验知识，通常在先验知识的支持下模型能够获得更好的自动补全结果。

正如人在“脑补”时常会出现错误，“脑补”算法也不可避免会出现错误。张道强认为，“脑补”算法的难点首先在于数据。机器学习、深度学习模型是一种数据驱动的模型，通常需要“看见”数据，才能够“脑补”数据。无论是通过数据库查询方式还是对抗生成网络方式（GAN），都需要大量的数据作为依赖。当数据量不够大时，机器就会“脑补”出错误内容，而这也是一个机器学习、深度学习方法的重要难点问题之一。此外，缺失部分的多少也会影响到“脑补”的结果。“数据的缺失量决定了数据样本本身提供的信息量，因此如果缺失信息过多，很难对样本进行补全。”张道强表示，机器学习目前主要是以数据驱动的方式，对于未知数据的推测也是目前的研究重点之一。

“脑补”算法如何走进生活？

尽管人工智能“脑补”算法听起来有些复杂难懂，但实际上，生活中相关的应用有很多。例如，算法常常会根据用户的行为对用户进行画像，进而为用户推荐其可能喜欢的内容；日常生活中，人们常会使用软件去除图片上的马赛克，或者借助软件将模糊不清的旧照片恢复清晰等。“去除图像中的马赛克，以及从低分辨率到高分辨率图像的重建，实际上是通过机器学习方法实现‘脑补’。而在这些方面，人工智能‘脑补’都取得了不错的准确率。”张道强告诉《科技周刊》记者，为了进一步真实模拟人类“脑补”功能，近年来，他带领团队尝试通过“脑解码”的方式来探究大脑在感知周围环境时真实的神经响应模式。通过对人脑神经活动进行分析，团队利用机器学习算法来进行建模，从而解码环境中的相关视觉刺激。

“这种‘解码’，实际上包含了刺激标签预测和刺激图像重建两种不同的方式。”张道强解释，具体来说，标签预测是指判断当前所受的到底是哪种刺激，比如看到的是猫？是人？还是其他物体？而图像重建则是利用机器学习的回归算法来对刺激进行重构，从而更加形象地对感知到的物体进行展示。“通过我们正在研究的‘脑解码’来探寻人脑活动模式和对应刺激之间的关系，除了能够从大脑活动模式出发去解码相关刺激之外，其实还可以反向通过刺激来重建大脑的活动模式，从而挖掘神经科学相关的信息，例如被试者的脑功能是否正常等，应用前景广阔。”张道强说。

新华日报·交汇点记者谢诗涵蒋明睿