“亚布力中国企业家论坛第24届年会”于2024年2月21日-23日召开。小米集团人工智能实验室主任,NLP首席科学家王斌出席并演讲。

王斌首先介绍了大模型。

大模型领域的一个标志性事件是2022年11月30日ChatGPT的发布,ChatGPT是大模型的产品形态,起背后是大模型技术在支撑,发布之后,引爆了AI领域,甚至科技界。

王斌说,ChatGPT看上去是一个对话机器人,但实际上也不很简单。首先,ChatGPT有很强的容错能力。第二,ChatGPT拥有非常渊博的知识。

ChatGPT的出现,也使得AGI概念火爆。

王斌解释说,AGI被称为强AI,简单来说就是像人一样,人拥有的多种能力它都有。“以前我们说的弱AI,是指拥有某一方面的能力,比如我会下围棋,但是我做别的事可能就不行了,AGI是通用人工智能,是人工智能未来的一个方向”。

王斌直言,ChatGPT让自己震惊。“原来我们觉得,AGI在我这一辈子或者下下辈子可能都看不到,但是突然间出现这个大杀器,我觉得有可能看到了,或者说越来越有信心了”,他说,ChatGPT出现本身有一定的偶然性,但是AI技术的发展是必然。

在王斌看来,“AI的发展就是人类追求躺平之路——AI来了,让机器都做了,人插一个管子,指挥一些机器人就全干了,又能创造极大的价值。所以,整个AI技术范式的演进其实就是人类解放自己的路”。

但是,AI技术发展过程中有两个问题,一是人力费用高,需要尽量少的人参与。二是复用性差。这两个位问题需要得到克服。

“OpenAI ChatGPT出来之后,其实最紧张的应该是我,因为我是NLP首席科学家,但实际上NLP突然间没有了,任务都被ChatGPT给完爆了”,王斌说。

他解释说,因为ChatGPT能够把所有文字看成文字接龙游戏。“其实图片、视频、音频也可以看成是‘文字’接龙产生的,只要我们把它划成切片,这也保证了为什么多模态模型存在一个理论基础,它是可以通过这种方式来统一实现的”。

王斌还认为,大模型会逐渐演进为轻量化的小模型。因为,大模型成本比较高,而且在使用时,不是所有人都需要大模型的通用能力,很多业务只需要做一两个任务,因此,小模型可以支持得很好工作。

责任编辑:梁斌 SF055

相关文章