#人工智能#从能量效率的观点,告诉你为何人工智能无法掌控世界——《眼见为凭》

如果你不知道目的地是哪儿,可能要设定其他目标。——尤吉.贝拉(Yogi Berra)

监督学习与无监督学习

我们每天都听到机器学习能够做到需要感知才能达成的任务:自动驾驶汽车、脸部辨识等。也有人担心智慧机器失控所造成的危险,害怕有天它们利用远胜于人类的智能,会掌控整个世界。不过这些讨论绝大部分都没有看到明显的重点:机器学习的确能够完成一些了不起的任务,但是研究人工智能的家伙全都深深了解到,现在最佳的人工智能还比不上四岁的孩子。

原因在于,绝大部分著名的人工智能算法在学习技能时要人教,同时需要使用到极庞大的数据库,并且得在超级计算机上执行。四岁幼儿只要知道几个例子之后,自己就能够学习。说真的,教自己小孩某些技能和概念时的确痛苦万分,但是他们绝大部分知道的事物,都是基于基本的感知机制,自己教自己的结果,用他们小小的脑袋就足以完成。事实上,就算是多层级且具备反向传播的感知器,比起我的小孙子还是差太多了。他不需要数不清的例子和教师,就能认得出自己的祖父。只要抱几次就很快学会说「爷爷」这个词。

四岁幼儿只要知道几个例子之后,自己就能够学习。

人工智能研究人员区分了监督学习与无监督学习。你应该记得之前提到那个标准的感知器需要教师。苹果计算机的声音识别软件和咸诺斯基会说话的计算机也要。注重隐私权者所害怕的脸部辨识软件也需要。你需要大量具备身份标签的脸部照片,才能够教软件辨识脸部。计算机能够办得到是因为计算速度非常快,事实上,最近几年机器学习获得的成就,主要来自于最近(五年)有了能够用来训练的数据库,以及大型的客制化计算机。脑中神经元运作的速度很慢,无法看这些计算机相比。

但是脑部的能力远超出这些计算机。在赫柏原始的概念中,创造细胞群组的方式是无监督学习:在边缘上连续的点本来就会一起出现,脑中的边缘敏感细胞也是自己出现的。目前计算机科学家迫切的任务之一,是建造出训练过程如大脑的机器。

计算机也是从错误中学习

我很快就会回来谈脑部,不过先说明另一种机器学习形式的例子,这种形式结合了神经网络和一个新方法。计算机科学家大方的用神经科学的名词来称呼这类策略:增强原理(principle of reinforcement),最早有系统进行这方面研究的是伟大的俄罗斯生理学家帕夫洛夫(Pavlov),哈佛大学的史金纳(B. F. Skinner)等后继者发掘了其中的细节。计算机科学家称这种这种算法为「增强学习」(reinforcement learning)。「增强」的意思是某种行为会得到报偿,如果计算机受到了报偿,就会重复那种行为。这个过程让正确的行为比较容易受到重复,在神经网络中的突触会受到加强,你可以说这是一种反向传播。增强学习与感知学习很像,只不过计算机会自己制造教师。

增强原理应用——史金纳箱。

计算机也可以得到报偿。在增强学习的过程中,计算机的找寻一个目标,它会随便乱猜,刚开始都猜错,但是如果某个猜测结果稍微接近目标,就会得到报偿。计算机得到的报偿不是一块计算机狗粮,而是得到讯息:「干得好,增强刚才你做出这个猜想时用到的突触。」接下来计算机会继续猜,这次会使用新的加权。接下来的步骤你可以想象出来:计算机会持续猜测,每次都调整加权,直到学得完成任务的方法。

人脑与计算机谁比较聪明?

增强学习已经精通了一项极为艰难的技术:下西洋棋,以及更为困难的围棋。现在计算机的棋力超强,完全胜过人类,而且他们还是自己教自己下棋。我想到的一个算法是 Alpha Zero,在二○一八年圣诞节前夕于《自然》杂志上发表研究结果。研究人员只教 Alpha Zero 围棋的规则:棋盘的模样、下棋的方式等,之后算法会自己和自己下西洋棋或是围棋。这种作法听起来违背直觉,重点在于每个「自己」并不知道另一个「自己」的思考内容,只知道对方下的棋步。也没有教师,只有一些事先输入的规则,让计算机知道下的棋步是好是坏,以及判定输赢的标准。四个小时后,计算机就具备了世界级的水平。

这真是非常了不起的成就,而且不只可以让 Alpha Zero 下各种棋类,还可以让它做别的事情。谷歌人工智能团队的戴维(David Silver)展示了 Alpha Zero 利用遥控器操纵玩具直升机进行飞行特技,看到那个直升机进行筒状翻滚飞行(barrel roll),真的让人确信它有能力。

计算机对于任务定义范围叫人狭隘。

但是 Alpha Zero 真的比我的孙子聪明吗?差得远了(除非我孙子和它较量西洋棋)。计算机对于任务定义的范围非常狭隘,而且体积要比我孙子的脑大多了,也不能光靠巧克力夹心饼干就能运作。史密森尼学会(Smithsonian)的吴凯瑟琳(Katherine Wu)估计,Alpha Zero 硬件运作功率约为一百万瓦,我孙子的脑只需二十瓦。会在这里提到神经网络和增强学习,是因为这两者都属于概念验证(Alpha Zero 内部采用了神经网络),证明了这种逻辑运算的结果虽然距离脑还差得远,但的确比较接近脑。

人类的脑部是否也采用了类似深度神经网络或是 Alpha Zero 所运作的方式?当然有,只是慢得不得了。人脑这种计算机是演化经由无数时光打造而成,其中的突触和联结都缩小到极致。如果有一堆计算芯片组成的笨重计算机能够办得到,人脑也可以。

人工智能领域中的人很清楚我的孙子远胜过他们的计算机,并且也正在努力改进。每个人都猜计算机会有多聪明。我认为计算机最后会很聪明,我绝对不会想要和计算机竞争。有各种巧妙的无监督学习模式应用在计算机中,唯一的问题是要花多少时间才能追得上人脑,以及机器完成任务的方式和真正的人脑有多相近。更重要的是,机器完成任务的经济效率能够比得上人脑吗,我会屏息以待这些结果。事实上就目前来说,光是超越人类的计算机所需要消耗的能量之高,就让我无须担心会计算机会掌控世界了。

相关文章