从能量效率的观点，告诉你为何人工智能无法掌控世界！

#人工智能#从能量效率的观点，告诉你为何人工智能无法掌控世界——《眼见为凭》

如果你不知道目的地是哪儿，可能要设定其他目标。——尤吉．贝拉（Yogi Berra）

监督学习与无监督学习

我们每天都听到机器学习能够做到需要感知才能达成的任务：自动驾驶汽车、脸部辨识等。也有人担心智慧机器失控所造成的危险，害怕有天它们利用远胜于人类的智能，会掌控整个世界。不过这些讨论绝大部分都没有看到明显的重点：机器学习的确能够完成一些了不起的任务，但是研究人工智能的家伙全都深深了解到，现在最佳的人工智能还比不上四岁的孩子。

原因在于，绝大部分著名的人工智能算法在学习技能时要人教，同时需要使用到极庞大的数据库，并且得在超级计算机上执行。四岁幼儿只要知道几个例子之后，自己就能够学习。说真的，教自己小孩某些技能和概念时的确痛苦万分，但是他们绝大部分知道的事物，都是基于基本的感知机制，自己教自己的结果，用他们小小的脑袋就足以完成。事实上，就算是多层级且具备反向传播的感知器，比起我的小孙子还是差太多了。他不需要数不清的例子和教师，就能认得出自己的祖父。只要抱几次就很快学会说「爷爷」这个词。

四岁幼儿只要知道几个例子之后，自己就能够学习。

人工智能研究人员区分了监督学习与无监督学习。你应该记得之前提到那个标准的感知器需要教师。苹果计算机的声音识别软件和咸诺斯基会说话的计算机也要。注重隐私权者所害怕的脸部辨识软件也需要。你需要大量具备身份标签的脸部照片，才能够教软件辨识脸部。计算机能够办得到是因为计算速度非常快，事实上，最近几年机器学习获得的成就，主要来自于最近（五年）有了能够用来训练的数据库，以及大型的客制化计算机。脑中神经元运作的速度很慢，无法看这些计算机相比。

但是脑部的能力远超出这些计算机。在赫柏原始的概念中，创造细胞群组的方式是无监督学习：在边缘上连续的点本来就会一起出现，脑中的边缘敏感细胞也是自己出现的。目前计算机科学家迫切的任务之一，是建造出训练过程如大脑的机器。

计算机也是从错误中学习

我很快就会回来谈脑部，不过先说明另一种机器学习形式的例子，这种形式结合了神经网络和一个新方法。计算机科学家大方的用神经科学的名词来称呼这类策略：增强原理（principle of reinforcement），最早有系统进行这方面研究的是伟大的俄罗斯生理学家帕夫洛夫（Pavlov），哈佛大学的史金纳（B. F. Skinner）等后继者发掘了其中的细节。计算机科学家称这种这种算法为「增强学习」（reinforcement learning）。「增强」的意思是某种行为会得到报偿，如果计算机受到了报偿，就会重复那种行为。这个过程让正确的行为比较容易受到重复，在神经网络中的突触会受到加强，你可以说这是一种反向传播。增强学习与感知学习很像，只不过计算机会自己制造教师。

增强原理应用——史金纳箱。

计算机也可以得到报偿。在增强学习的过程中，计算机的找寻一个目标，它会随便乱猜，刚开始都猜错，但是如果某个猜测结果稍微接近目标，就会得到报偿。计算机得到的报偿不是一块计算机狗粮，而是得到讯息：「干得好，增强刚才你做出这个猜想时用到的突触。」接下来计算机会继续猜，这次会使用新的加权。接下来的步骤你可以想象出来：计算机会持续猜测，每次都调整加权，直到学得完成任务的方法。

人脑与计算机谁比较聪明？

增强学习已经精通了一项极为艰难的技术：下西洋棋，以及更为困难的围棋。现在计算机的棋力超强，完全胜过人类，而且他们还是自己教自己下棋。我想到的一个算法是 Alpha Zero，在二○一八年圣诞节前夕于《自然》杂志上发表研究结果。研究人员只教 Alpha Zero 围棋的规则：棋盘的模样、下棋的方式等，之后算法会自己和自己下西洋棋或是围棋。这种作法听起来违背直觉，重点在于每个「自己」并不知道另一个「自己」的思考内容，只知道对方下的棋步。也没有教师，只有一些事先输入的规则，让计算机知道下的棋步是好是坏，以及判定输赢的标准。四个小时后，计算机就具备了世界级的水平。

这真是非常了不起的成就，而且不只可以让 Alpha Zero 下各种棋类，还可以让它做别的事情。谷歌人工智能团队的戴维（David Silver）展示了 Alpha Zero 利用遥控器操纵玩具直升机进行飞行特技，看到那个直升机进行筒状翻滚飞行（barrel roll），真的让人确信它有能力。

计算机对于任务定义范围叫人狭隘。

但是 Alpha Zero 真的比我的孙子聪明吗？差得远了（除非我孙子和它较量西洋棋）。计算机对于任务定义的范围非常狭隘，而且体积要比我孙子的脑大多了，也不能光靠巧克力夹心饼干就能运作。史密森尼学会（Smithsonian）的吴凯瑟琳（Katherine Wu）估计，Alpha Zero 硬件运作功率约为一百万瓦，我孙子的脑只需二十瓦。会在这里提到神经网络和增强学习，是因为这两者都属于概念验证（Alpha Zero 内部采用了神经网络），证明了这种逻辑运算的结果虽然距离脑还差得远，但的确比较接近脑。

人类的脑部是否也采用了类似深度神经网络或是 Alpha Zero 所运作的方式？当然有，只是慢得不得了。人脑这种计算机是演化经由无数时光打造而成，其中的突触和联结都缩小到极致。如果有一堆计算芯片组成的笨重计算机能够办得到，人脑也可以。

人工智能领域中的人很清楚我的孙子远胜过他们的计算机，并且也正在努力改进。每个人都猜计算机会有多聪明。我认为计算机最后会很聪明，我绝对不会想要和计算机竞争。有各种巧妙的无监督学习模式应用在计算机中，唯一的问题是要花多少时间才能追得上人脑，以及机器完成任务的方式和真正的人脑有多相近。更重要的是，机器完成任务的经济效率能够比得上人脑吗，我会屏息以待这些结果。事实上就目前来说，光是超越人类的计算机所需要消耗的能量之高，就让我无须担心会计算机会掌控世界了。

从能量效率的观点，告诉你为何人工智能无法掌控世界！

热门新闻

周热门

从能量效率的观点，告诉你为何人工智能无法掌控世界！

Meta Q1业绩会实录：虽然AI产品还没盈利，会持续投资和扩展规模

数字供应链中的10个顶级成功案例

氪星晚报｜阿里发布职业趋势报告：AI能力正在成为职场关键竞争力；零跑C16北京车展预售发布；雷军：汽车工厂至少能带动5—6倍的周边产业

最前线｜高德发布好的出租3.0，为出租车提供灵活调价能力

图灵奖得主杨立昆：大语言模型是通往AGI的一条歧路

主营电动工具DIY场景，「铁腕创新」完成近2500万元天使轮融资｜36氪首发

禾赛科技李一帆：激光雷达应该是商品，不能卖一台亏一台｜36氪专访

推行动物实验替代计划，临床前CRO巨头的“阳谋”

人工智能在教育中的43种用途

何为数据化运营？

酒店新零售和酒店机器人……

小米汽车将推出纯电SUV，同时规划更低价车型｜独家

AI搞砸工作谁“抗雷”

8点1氪丨斗鱼主播小团团被捕，或面临3至5年刑期；于东来称去年计划挣2000万结果赚了1.4亿；苹果将于5月7日举行发布会

应避免的八个数据战略错误

热门新闻

周热门