文 | AI国际站 唐恩

是什么能让人类如此高效地学习事物的主要算法?这个问题困扰着人工智能科学家和研究人员,在过去的几十年中,他们一直在尝试复制人脑的思维和解决问题的能力。创建思维机器的梦想激发了AI领域的许多创新,并且最近推动了深度学习的兴起,深度学习AI算法大致模拟了大脑的学习功能。

但是,正如一些科学家认为的那样,强力学习并不是赋予人类和动物出生后不久与世界互动的能力的原因。关键是有机大脑的结构和先天能力,这种观点在当今的AI社区中大多被驳回,而人工神经网络主导了这一论点。

神经科学冷泉港实验室教授Anthony Zador在同行评审期刊《自然》上发表的一篇论文中指出,这是一个高度结构化的大脑,可以使动物成为非常高效的学习者。Zador的论文标题为“对纯学习以及人工神经网络可以从动物大脑学到的知识的批判”,解释了为何扩大AI算法的当前数据处理能力将无法帮助提高狗的智能,更不用说人类了。Zador解释说,我们需要的不是从头开始学习一切的AI,而是像有机物一样具有内在能力的算法可以与学习经验相辅相成。

人工与自然学习

在人工智能的整个历史中,科学家一直将自然作为开发能够表现出智能行为的技术的指南。自从该领域的历史开始以来,符号人工智能和人工神经网络就构成了开发AI系统的两种主要方法。

Zador写道:“符号AI可以看作是心理学家的方法,它从人类的认知过程中汲取了灵感,而没有试图破解黑匣子,而使用类神经元元素的ANN则从神经科学中汲取灵感。”

在AI历史的前几十年中,由程序员明确定义系统规则的符号系统占据了主导地位,而如今,神经网络已成为人工智能大多数发展的主要亮点。

人工神经网络受到其生物学对应物的启发,并试图模仿有机大脑的学习行为。但是正如Zador解释的那样,人工神经网络中的学习与大脑中发生的事情有很大不同。他写道:“在人工神经网络中,学习是指从输入数据中提取结构(统计规律性)并将该结构编码为网络参数的过程。”

例如,当您开发卷积神经网络时,您将从一块空白板开始,这是一层由随机权重连接的人工神经元的分层结构。当您在图像及其相关标签上训练网络时,它将逐渐调整其数百万个参数,以便能够将每个图像放入其合法的存储桶中。并且过去的几年表明,神经网络的性能随着更多的层,参数和数据的增加而提高。(实际上,还涉及许多其他复杂性,例如调整超参数,但这将是另一篇文章的主题。)

人工神经元和生物神经元之间有一些相似之处,例如人工神经网络设法从图像中提取低级和高级特征。但是当涉及到人类和动物时,学习会发现不同的含义。扎多尔写道:“神经科学(和心理学)中的“学习”一词指的是行为的长期变化,这是经验的结果。”

人工学习与自然学习之间的差异不仅限于定义。在监督式学习中,在人工标记的数据上训练神经网络(例如上述示例),这些差异变得更加明显。

扎多尔观察到:“尽管这次训练的最终结果是一种人工神经网络,其能力至少在表面上模仿了人类对图像进行分类的能力,但是人工系统的学习过程与新生儿的学习过程几乎没有相似之处。”

孩子们大多学会了自己探索世界的方式,不需要太多的指导,而监督算法仍然是深度学习的主要形式,它需要数百万张带有标签的图像。“很明显,孩子们并不主要依靠监督算法来学习对物体进行分类,”扎多尔写道。

正在进行有关无监督或自我监督的AI算法的研究,这些算法可以在很少或没有人类指导的情况下学习表示。但是结果是非常基本的,低于监督学习所取得的结果。

为什么无监督学习是不够的

“可以想象,无监督学习,利用比尚未发现的算法更强大的算法,可以在建立感官表现和驾驶行为方面发挥作用。但是,即使是这样一种假设的无监督学习算法也不是全部。

例如,大多数新生动物在如此短的时间内(数周,数天,数小时)学习关键技能(步行,奔跑,跳跃),而在空白板岩神经网络上进行纯粹的无监督学习则是不可能的。扎多尔写道:“动物行为表述的很大一部分不是聪明的学习算法(有监督或无监督)的结果,而是出生时已经存在的行为程序的结果。”

同时,先天的能力无法使动物适应不断变化的环境。因此,他们都有学习和适应环境的能力。

两者之间需要权衡。太多的天赋和太多的学习会使您脚步加快,并帮助您履行在环境中生存并将基因传给下一代的进化职责。但这会剥夺您适应环境中各种变量(天气,自然灾害,疾病等)的灵活性。这就解释了为什么婴儿需要整整一年的时间才能迈出第一步,而小猫则在出生后一个月学会走路。

天生的能力和学习能力是相辅相成的。例如,人类儿童的大脑具有将面孔与其他事物区分开的功能。然后,他们一生会学会将特定的面孔与自己认识的人联系起来。另一方面,松鼠具有记住它们所掩埋物体位置的先天技能,并且根据一些研究,它们可以记住成千上万个坚果储存库的确切位置。

这些先天的机制以及对学习特定事物的偏爱是Zador称之为基因组中编码的“自然的秘密调味料”。扎多尔在论文中写道:“具体地说,基因组编码了连接其神经系统的蓝图。”这些蓝图是经过数亿年的进化而选择出来的,其作用于无数的个人。这些蓝图指定的电路为先天行为以及动物一生中发生的任何学习提供了基础。

那么,基因组到底包含什么呢?答案因人而异。例如,在蠕虫等超简单的生物中,基因组包含了整个神经连接的所有细节。但是对于像人脑这样的复杂系统,它具有大约如果有1000亿个神经元和100万亿个突触,就无法对基因组中的所有内容进行编码,而基因组的空间约为1 GB。

扎多尔说:“在大多数大脑中,基因组不能指定明确的接线图,而必须指定一套在发育过程中连接大脑的规则。”

进化与学习

因此,生物大脑具有两套行为优化机制。一方面,他们具有学习能力,使每个物种的每个人都能发展自己的特定行为,并根据其一生的经历对其进行微调。另一方面,一个物种的所有个体都拥有丰富的先天能力,这些先天能力已根深蒂固地存在于他们的基因组中。“基因组不能直接编码表征或行为;“它编码接线规则和连接图案。”

基因组本身也不是恒定的。当它从一代传给下一代时,它会经历无穷小的变换和突变。进化和自然选择发挥了魔力,并确保在成千上万的世代中,更好的变化得以生存,而坏的变化则得以消除。在这方面,可以说,基因组也经历了优化和增强,尽管所花费的时间比个人的生命大得多。

Zador将这两个优化机制可视化为两个同心循环:外部演化循环和内部学习循环。另一方面,人工神经网络只有一个优化机制。他们从一片空白开始,必须从零开始学习一切。这就是为什么他们需要大量的培训时间和示例来学习最简单的东西。

扎多尔观察到:“人工神经网络参与了一个优化过程,该过程必须模仿在进化过程中所学到的知识以及一生中的学习过程,而对于动物而言,学习仅指的是一生中的变化。”“这种观点认为,人工神经网络中的监督学习不应被视为动物学习的类似物。”

人工神经网络必须如何发展

扎多尔写道:“先天机制的重要性表明,解决新问题的人工神经网络应尽可能地尝试以先前相关问题的解决方案为基础。”

AI研究人员已经设计出了转移学习技术,其中一种训练过的神经网络的参数权重转移到了另一种。转移学习有助于减少为新任务训练神经网络所需的时间和新数据样本的数量。

但是,人工神经网络之间的转移学习与通过基因在动物和人类之间传递的信息并不相似。“尽管在转移学习中,ANN的整个连接矩阵(或其中的很大一部分)通常用作起点,但在动物大脑中,一代一代“转移”的信息量较小,因为它必须穿过瓶颈基因组”。

人工神经网络当前缺少的另一件事是架构优化。通过盲目的进化机制,基因组学会优化大脑的结构和布线规则,从而更好地解决每种物种的具体问题。另一方面,人工神经网络只限于优化其参数。他们没有递归的自我完善机制,可以使他们创建更好的算法。对其体系结构的更改必须来自外部(或有限的超参数调整技术,例如网格搜索和AutoML)。

可能类似于基因组进化优化的一件事是不同ANN架构的发明,例如卷积网络,递归神经网络,长短期记忆网络,胶囊网络,变形金刚等。这些体系结构帮助创建了可以有效解决不同问题的网络。但是它们并不完全是基因组的功能。

Zador在书面评论中对媒体说:“所有这些新架构都令人印象深刻,但是我不确定它们与通过进化而来的架构有多相似。”进化的关键是架构需要压缩到基因组中。这个“基因瓶颈”起到了调节器的作用,并迫使系统捕获任何架构的基本要素。”

其他科学家建议将神经网络与其他AI技术(例如符号推理系统)结合使用。该混合AI的做法已经被证明是更多的数据高效纯神经网络,目前不同的研究小组的重点,如麻省理工学院,IBM沃森人工智能实验室。

Zador对这种方法持怀疑态度,并认为人工神经网络发展人工智能的机会更大。“尽管人工神经网络的处理元素比真实的神经元要简单,例如,它们缺乏树突。但我认为它们可能足够接近。人工神经网络是通用逼近器这一事实具有启发性。

但是,他的确通过提醒我们结束研究而结束了论文,最终,对动物大脑的研究可能不是AI问题的全部答案。

有时被误导为“人工智能”的说法根本不是一般的;它非常严格地限制了人员的能力,以致只有结构类似于大脑的机器才能实现它。

相关文章