动口不动手的时代来了!

作为一名风险投资人,新希望集团华东区投资总监朱光需要时刻注意市场最新动态。除了阅读之外,他是音频的爱好者。作为得到和混沌商学院的重度用户,他喜欢在早晨边听app中的音频,边做笔记:“这是最好的吸收资讯的方式。”他五岁的儿子则是喜马拉雅app的用户,喜欢收听英语和唐诗节目。

在他杭州的家中,还有小爱和天猫精灵两个智能音箱。他不再需要动手,只要口头下达命令,小爱或天猫精灵就会执行,例如播放音乐、上网购物、单位换算、了解天气预报或星座预测,甚至和他对谈,回答问题。

和朱光有着相似消费习惯的人群数量庞大。喜马拉雅的用户规模已经超过4.7亿。2017年不温不火的“千箱大战”暂告一个段落后,根据调研机构Canalys报告,领先者阿里巴巴推出的天猫精灵和小米的小爱音箱在今年第一季度的销量分别达到100万台和60万台,分别位列全球市场的3、4位。基于音频的内容生态逐渐完善,声音类新媒体“程一电台”在2018年8月完成了A轮融资;基于微信公号的声音媒体“夜听”也获得了真格基金的投资。如果五年前的声音市场仍是音乐播放软件、传统音箱等产品的生意,今天随着语音交互技术的成熟、智能音箱硬件的普及、内容生态的丰富,声音已是一门大生意。

这是一场新的“权力的游戏”。正如iPhone的发明和智能手机潮,让触控技术成为主流,带动了移动互联网的创新浪潮,声音的时代此刻正在到来。“这是一个确定的、正在爆发的市场,”声智创始人陈孝良表示,“随着语音交互产品的崛起,今天手机的核心地位将被淡化。”在他看来,智能音箱只是现行语音交互和人工智能的一个突破点,未来的语音交互将出现在生活周围的各个设备。

智能音箱的战争并未结束,而是刚刚开始。市场调研公司 Canalys预测,智能音箱在全球范围内快速普及,预计 2018 年保有量将接近 1 亿台,未来几年仍将保持快速增长势头,用户量有望在2022年超过3亿。行业的入局者既包括阿里、小米等大公司,也有创业公司;在全球范围内,亚马逊、Google、苹果、三星等公司也对这一市场野心勃勃。在中国,较晚起步的手机厂商们正在杀入这一领域。2018年初华为消费者BG智能家居产品线负责人闪罡就透露道,今年华为也有望推出智能音箱;在7月份举行的极客公园 Rebuild 2018 科技商业峰会上,锤子科技创始人罗永浩也向现场观众透露,他们也在开发智能音箱。

交互方式的改进,带来的不仅是便利性的提高,甚至对科技行业产生颠覆性影响。自从爱迪生发明留声机以来,人类一直在和机器交谈,但目的是为了与其他人交流,而不是与机器。现在,智能语音市场已经形成了包括底层基础设施(芯片、传感器)、中层技术(语音交互、语义识别)、顶层应用(输入法、娱乐、家居、教育)的完整产业链结构。Doppler的前音频工程主管金茨·克利马尼斯(Gints Klimanis)在接受《快公司》访谈时表示:“智能手机可能不会完全消失,但是语音命令和听觉的结合可能会成为任何自发行为的主要交互入口。”

重新定义“连接”

从PC时代的键盘鼠标到移动互联网时代的触屏操控,每次交互入口的演变将带来一场革命。此刻,全球智能语音市场已经全面爆发,应用场景覆盖智能家居、车载等多个领域。当语音交互有机会重构未来信息生态和生活,而中国公司第一次获得有望打造底层技术平台的机会,重新定义人与声音、人与语言、人与万物的连接。“融合语音和肢体动作的交互方式或许更可能成为下一个时代的主宰,语音显然会是必不可少的一环。”东方证券分析师张颖这样表示。背靠十亿消费者市场、日趋成熟的软硬件技术环境,中国科技公司们正在迎来新的浪潮。

2016年,陈孝良决定从中科院辞职时,他一度感到纠结。他所供职的声学所,是一个冷门机构,大多数毕业生都流向了军方或科研机构。在中科院工作多年的陈孝良,最终决定离职创办了一家声学与语音智能公司,它能从底层声学技术入手,为进入这一领域的公司提供智能音箱的解决方案。

声智创始人陈孝良

出乎他意料,生意很快迎来了爆发:2017年年初在美国拉斯韦加斯举办的CES,让中国科技公司们注意力第一次放到了亚马逊身上—这家公司推出的Echo音箱获得了超过500万销量。“Echo代表着智能语音交互产品第一次获得了规模化销量,并得到了消费者们的认可。”但在陈孝良眼里,不少找上门来、渴望在语音市场里获利的中国公司并不具备技术研发基础和打造消费级产品的能力,“这是一个入门容易,深入难的市场。智能音箱考验的是一家公司用户触达能力、语音与AI 技术、生态整合能力等多重实力。”

不会撒谎的市场

市场很快变得疯狂。从互联网公司、传统音箱公司到家电公司、DVD公司,嗅觉敏锐的中国公司闻风而动。2017年新媒体智东西曾发表文章指出,全世界80%以上的音箱由深圳生产,然后出口到海外各地。围绕着对外贸易,深圳汇聚了庞大且复杂的产业链集群,福永、沙井、龙岗几个地区栖息着上千家中小音箱代工厂,汇聚着数十万工人,他们处于产业链的最底端,赚着最微薄的辛苦钱。

市场最终如陈孝良所预料:被有消费者号召力的公司所收割。上百款智能音箱推出后,反响平平。目前的市场领先者是天猫精灵和小爱同学。这两款产品的特点之一是价格位于百元区间。科技巨头丰富的产品线、极具竞争力的定价策略、突出的技术实力等,正在使后进入者难以追赶。

随着第一波想赚快钱的公司出局,战争并没有结束,而是进入了深水区。2018年第一季度,Canalys表示智能音箱销量同比增长了210%。中国市场之外,全球科技巨头们正在为价值数十亿美元的智能音箱及其背后的市场继续搏斗。和阿里、小米的策略类似,这些公司均采用激进的定价策略,将销量视为最核心的目标之一。“在巨头补贴的情况下,也许明年买一台智能音箱补贴消费者十块钱的情况都可能发生。”出门问问创始人李志飞曾这样表示。

智能音箱开始分流手机用户。中信证券研报《智能语音:快速崛起的人工智能入口》显示,语音助手具有较好的用户黏性,同时用户对语音助手的使用对智能手机、pad 等现有设备已具有显著的替代和分流作用。

AI与声音

智能音箱只是台面上的狂欢,各大厂商们争夺的是移动互联网之后的稀缺入口。“在即将到来的万物互联时代,次类型的入口以及语音交互的形式极有可能会成为主流。”国泰君安发布的报告《智能声学创新开启语音交互新时代》这样表示。比智能音箱更有价值的是支撑其服务的开放平台,如支撑Echo设备运行的是亚马逊开发的Alexa平台,目前开发者基于Alexa开发的应用技能已超过45000种。打造智能语音生态等的同时,各大公司也通过智能语音技术能力的开放,提升自身在行业市场的参与度,比如百度 DuerOS、科大讯飞等国内巨头均开放了语音识别、语义分析、语音合成、计算机视觉等基础 AI 能力。

全球科技公司对语音技术的研发投入从未停止。从 1970 年代起,语音助理(Virtual Personal Assistant)产品就已经陆续面世。然而,软硬件的技术不成熟导致这一领域并未成为值得开垦的富矿。2001年,计算机语音识别达到了80%的准确度,但这一准确率仍不足以让语音提供比键盘更高效的交互效果。技术实现突破的原因在于AI 技术。过去主要依靠算法的进步和样本的积累,随着深度学习算法的出现,语音识别的准确率有了明显的进步,目前语音识别引擎已经达到95%的准确度。此外,硬件端麦克风阵列解决远场语音交互难题,除了声智,讯飞、思必驰等国内供应商也推出了诸多麦克风阵列解决方案。

全球智能语音产业规模快速增长&中国智能语音产业规模增速显著高于全球市场

分析师们看好语音的崛起,认为这是科技发展的必然。中信证券分析师徐英博表示:“人类人机交互的过程,大致经历了从人适应智能计算设备到设备适应人的过程,从早期黑白文字界面、到图形用户界面,以及目前的多点触控、语音会话等,人机交互方式的演进伴随着交互自然性、承载的信息量持续改善。智能语音的出现,推动人机交互方式更为顺畅、自然和富有效率,其发展遵从人机交互方式不断进化的客观规律,具有历史必然性。”

交互世界

语音交互涉及了复杂的技术链条,包括了声学处理、语音识别、语义理解和语音合成等核心技术。随着人工智能、声学等技术的发展,语音交互的技术难关正在被攻破。智能语音作为 AI 平台性技术,向下实现 AI 底层运算能力调用,向上和应用场景融合,和计算机视觉等类似,是 AI 重要入口。当前智能语音已在个人用户领域,以及金融、医疗、教育等行业市场得到广泛应用,并承担在线客服、电子病历转录、个人助理等功能,推动人机交互,显著提升业务效率。

“交互方式的改进,如果只是带来纯粹的便利性,那就只是一个更好的功能,但如果这种交互方式影响了信息的整合与输出方式,那就会对行业产生颠覆性影响,”声智科技副总裁李智勇在虎嗅专栏文章《想成为下一个BAT,还得搞语音交互》中这样表示,“从现象上看,最直接的影响是app会消失。”他解释,语音交互意味着更加大一统的科技格局,因为用户不用打开app同时也不会再有和浏览器相并列的大客户端,所做的只是输入一句话。

语音交互的开路先锋亚马逊就认为,自己所创造的Echo设备与过去通过Pad或者手机能获得的服务完全不同。Echo 于 2014 年 11 月正式推出,产品测试阶段仅提供给少数客户购买, 2015 年正式上市后扩大至全美客户。 亚马逊全球设备与硬件的负责人Dave Limp告诉《商业周刊/中文版》:“过去的设备需要消费者通过鼠标、键盘、屏幕与之交互,这种交互只局限于一对一的形式,消费者与计算机的交互就留在了某一台机器上,不会到任何地方,也不能跟其他任何用户去分享。而Alexa和Echo作为一款全新的产品和服务,人机界面是完全不同的,让人感觉更亲和,可以让用户感觉它随时都在。因为Echo随时可用,用户可在房间内充分信赖它,比如设置厨房计时器、播放悦耳的音乐,甚至检查孩子的作业,这就变成了更亲密的人机关系,让它变成消费者生活中的一部分。”

亚马逊创始人杰夫·贝索斯(Jeff Bezos)是《星际迷航》的骨灰级粉丝,Echo的发明来自《星际迷航》的启示。“我们用机器学习算法为网站用户做产品推荐,取得非常好的效果,消费者非常喜欢。当时我们在内部就对工程师说,在什么领域我们还可以更多地应用人工智能与机器学习算法,能够更好地让消费者获益?后来我们的团队就提出一个想法—如果我们能够把云提供的没有限制的计算能力,与机器学习和人工智能这两者结合在一起,那么会创造出一种类似《星际迷航》中的隐形电脑一样的设备。”Dave Limp这样表示。

亚马逊智能交互音响Echo

在《星际迷航》的宇宙飞船中,无论站在宇宙飞船的哪一个位置,都可以随意地发问,隐形电脑都可以找到答案。Dave Limp 说:“Echo产品本身是非常简单的,售价只有50美元左右,背后是Alexa,拥有巨大云计算能力和海量的知识,这是我们实现打造《星际迷航》隐形电脑的第一步。”随着Alexa的发展,其技能越来越广泛,除了购物、打车、控制电器等功能外,还有新闻、游戏、教育等方面的技能。

语音交互在中国

但不可讳言,亚马逊和谷歌并不是中国市场里强有力的参与者,这让中国科技公司在这一领域获得了更多机会:这一次,不仅是可以卖出更多产品,而是有机会打造一个底层技术平台。在中国,最类似亚马逊 Alexa + Echo 模式的是阿里及其推出的 AliGenie + “天猫精灵”组合,阿里选择了一条从语音平台到硬件产品全部由自己打造的路线。AliGenie 开发者平台,主要面向四种类型的开发者,包括内容开发者、应用开发者、智能家居开发商和硬件生产商。开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。

百度和腾讯也是市场的积极参与者。百度曾以千万美元的价格收购智能音箱创业公司“渡鸦”,推出Raven H后,渡鸦创始人吕骋已于2018年7月离职。目前,百度主推产品为小度智能音箱,腾讯则自主研发了听听AI音箱。

互联网巨头智能语音产品布局

落地艰难的智能家居也有望借助智能音箱而得以突破。现阶段,Echo、天猫精灵、小爱同学等产品均实现了家居控制功能。在“天猫精灵”的淘宝店铺上,除了销售音箱,还销售智能灯泡、插座等产品,通过智能插座和红外遥控,可以远程控制超过20000款传统家电。根据艾瑞咨询的数据显示,2016 年智能家居穿透率普遍不超过 5%,例如门锁 3.5%、照明系统 2.1%、洗衣机 1.8%、冰箱 1.1%,到了 2020 年预计各环节智能化渗透率都将超过 20%。中国智能家居市场规模也将在未来几年保持超过 50%的增速,预计到 2020 年将达 3294 亿元。

过去,中国人被认为并不是声音消费的爱好者,由于缺乏使用音箱的客厅文化,音箱一直是市场上的小众产品。然而,在《麻省理工评论》看来,中国是发展语音接口的理想市场。调研机构Canalys发现,中国市场的智能音箱发展速度远超全球。早在智能音箱市场发展之前,中国消费者曾经接受过一轮普及:2012年前后,Wi-Fi音箱开始在国内兴起,联网后可以播放流媒体音乐等内容。现在,音箱所能支撑和兼容的服务数量与质量成为竞争核心。看上去,这是一个必然由大公司主宰的领域。中信证券分析师徐英博认为,随着物联网基础设施完善,智能语音平台中长期具有和当前手机 OS 极为类似的战略重要性,作为平台属性突出的产品,其发展依赖于平台商、硬件商、内容&服务商等的共同参与,其运作模式类似于操作系统的典型生态模式,这也客观上决定了这必然是巨头主导的市场。

竞争不断

巨头环伺的智能音箱市场格局仍在不断变化。目前,谷歌的智能音箱Google home正在飞速赶上。Strategy analytics公司预测,亚马逊的全球市场份额从过去一年76%下降到了41%。“在智能音箱这个飞速变化的市场上,没有一家公司可以长期处于统治地位,如果有公司可以,也许会是谷歌。”

“声音的生意就只是智能音箱吗?显然不会,”陈孝良说,“亚马逊成功地开掘了智能音箱的潜力。中国公司为什么只能亦步亦趋地跟随式创新?我们有市场、有技术,应该去创造更多的产品,而不是等其他公司成功后再去模仿。”回顾Echo的发展历程,其问世并不起眼。Dave Limp表示,当初刚刚推出Echo的时候,它的功能非常少,在将Alexa平台接口开放后,成千上万的开发者被吸引,基于Alexa开发出上万种功能和应用,这吸引了更多的用户、更多的开发者、更多的应用和功能等。

智能语音背后的三类核心技术

智能音箱仅是语音交互时代的第一个标杆产品。“语音交互具有强大潜能,能带动全球智能链条的创新。智能音箱只是一个很好的突破点,将来肯定会衍生出众多的应用,甚至重构整个消费电子行业。”陈孝良这样表示,“语音是天生的人机交互入口,就像人和人之间用语言交流是很自然的事情,未来人类和机器之间直接用语言交流也将成为同样自然的事情。”

他明白自己的麦克风阵列技术方案面对的是企业客户,创新的核心仍在平台和硬件产品厂商层面:“每个技术兴起的时候都是沿着技术红利到产品红利到模式红利的路径。我们的技术是基础,让硬件商们可以发挥想象的基本的空间。就像我给你颜料和画笔一样,但是核心绝对不是颜料和画笔。”重要的是基于技术的创造力,他强调。

扩张的硬件,不变的市场

语音优先的硬件层仍在快速扩张。即将入局者有华为、facebook、松下等公司。市场研究机构Maximize Market Research报告显示,2026年全球智能语音市场预计将达到188.4亿美元,在2017年至2026年期间的年复合增长率为32.67%。研究咨询公司Ovum预测,2021年搭载智能语音助手的设备数量将超过75亿台,比当今世界的人口数都要多。

在硬件和底层技术平台快速崛起时,中国的音频内容生态圈经过多年的发展,也走到了成熟期。

喜马拉雅创立时处于一个不利的市场环境里。2012年,余建军与搭档陈小雨创业前曾经想过做几个不同的项目,但最后定下来做音频。他的上一个项目“那里世界”,因为经营不顺,100多个员工只剩8个。在艰难的时候,余建军每天都听马丁·路德·金的演讲,“只要听几句话,就好像充满电了。”当时,他的核心逻辑是觉得,因为移动互联网,音频是未来趋势,可以触达过去媒体没法触达的场景,比如开车、挤公交地铁、跑步、做家务等。喜马拉雅由此成立。然而,这一领域的未来并不被看好。2012年,正当余建军创业时,李开复恰巧发表了博文《语音微博是个伪命题》,业界的主流观点是不看好音频的未来。

音频内容的未来,被当时的人们低估了。走过了不被接受的探索阶段,如今,喜马拉雅的宣传文案是:“每条声音听一遍,600年才能听完。”台湾资深配音师周震宇,关注到大陆音频app的快速发展,他成为了蜻蜓app上的签约主播。他是广告、纪录片背后的配音员,十年前,他转行成为了一名“声音教练”,帮助需要对外发言的配音员、主播、企业发言人等客户做口语表达教育训练。现在,除了线下教学,他发现自己也热爱上了录制音频课程。

除了蜻蜓、喜马拉雅等产品,周震宇还是得到app上“精英日课”的忠实用户。最让周震宇惊讶的是大陆音频app上惊人的播放量。在喜马拉雅上,“晓说2018”栏目播放量已经达到7.3亿,主播“丸子”录制的网络文学《超品相师》有声书总播放量超过20亿。和周震宇相似的内容提供者已有百万量级。最新数据显示,喜马拉雅目前总用户规模突破4.7亿,平台内共有500万主播,其中包括20万名认证主播,活跃用户日均收听时长超过135分钟。除了国内市场,喜马拉雅还拥有超过3500万海外用户。

“声音最大的魅力在于陪伴”

众多内容提供者并不是和周震宇一样出身科班。喜马拉雅上名为“轩林”的主播今年才刚满20周岁,初中肄业。在朋友的介绍下,误打误撞成为了一名主播,因为录书,他曾经睡过两年行军床;为了音质效果,在炎热的夏天闷在一个小屋里而不敢开电扇。现在,他是一个拥有近60万粉丝的主播。在这个平台上,4S店销售、工程师、大学生都能获得机会。只要有一个麦克风、一台电脑、一个声卡,即使位于偏远城市,一个主播仍然可以通过声音和成千上万的用户连接。除了草根主播,电视台、广播电台、培训机构都是音频app上内容的来源,欧莱雅、肯德基等品牌也入驻了喜马拉雅,在平台上和消费者进行沟通。

在语音商业生态中,除了硬件和底层平台,内容平台和内容生产商是顶层应用里的重要一环。在中国市场,喜马拉雅FM已经逐渐搭建起来一套商业变现体系,通过广告、知识付费以及直播等形式,让入驻的主播们以及平台都能获得收益,余建军将这种模式形容为“声音的淘宝”。2017年,喜马拉雅推出了智能音箱“小雅”,完善音频生态的布局。商业化探索让这家公司成功打造了音频创业生态圈,形成了用户、内容商和平台的互动。除了喜马拉雅,音频平台在未来发展方向上存在差异化竞争,荔枝、蜻蜓等平台方在2018年先后获得了融资;2018年6月有声阅读平台“懒人听书”,近日完成C轮2亿元融资,由上市集团时代出版、前海天和、孚惠成长共同领投。

音频内容生产商也受到资本的垂青。2014年5月成立的程一电台,在今年8月宣布获得A轮融资。根据新榜报道,程一全网播放量累积超过25亿,而全网粉丝已经超过1200万。和程一电台类似的还有微信公号“夜听”,这家公司的微信听众累计达到2500万,在2017年获得了来自真格基金的投资。此外,樊登读书会、科学队长等有声书、音频直播等领域的头部公司也在近期获得融资。

“声音最大的魅力在于陪伴。音频可以在很多无法使用视频、文字的场景下使用,”周震宇认为音频内容领域仍将有很大发展空间,“它满足了人们碎片化时间的娱乐和知识需求。”在音频app上的收入,他需要和经纪人进行分成。对于现在的收益,他认为还有很大的提高空间,不过他认为自己最在意的不是钱,而是口碑,“我希望它成为经典的内容。”

当商业机会在向头部应用集中,希望在音频应用中获得机会的创业公司需要转向和智能硬件的结合。创丰资本投资人胡蕤认为,移动音频平台仍是产业链的核心环节。但移动音频内容生产与智能硬件领域也在逐渐升温,未来将于可穿戴设备、智能家居和车载硬件等诸多场景中得到应用。

在科幻电影《Her》当中,男主人公和智能语音系统“萨曼莎”发生了一段感情故事。人类既恐惧于机器可能拥有的不可控力量,又期待机器拥有更强智能和情感交互能力。

语音识别技术历史

1997年,MIT媒体实验室Picard教授提出了“情感计算”的概念。“许多人普遍认为计算机的情感是一种空洞无聊的东西,就像蛋糕表面上的一层糖霜,可以用来使之更为悦目,但没有真正实质上的意义。实际上,计算机通过对人类的情感进行获取、分类、识别和响应,可帮助使用者获得高效而又亲切的感觉。”他分析。

只是,目前的设备和软件均不能做到这一点。朱光对家中的天猫精灵、小爱同学的表现并不满意,“只是把它们当播放器使用。”大同小异的产品,并没有给用户带来新鲜体验。他认为,所有的设备都将“听得到”和“听得懂”用户在说什么,然后去执行相应任务—这个美妙的未来,似乎并不会那么快到来。

困难重重

无法多轮对话、对话生硬的问题仍存在。根据彭博新闻社报道,2012年,谷歌和多伦多大学的研究人员发表了一篇颇有影响力的论文,内容关于使用“深度神经网络”在电脑中模拟语音。几个月后,微软和IBM合作发表了另外一篇论文。谷歌工程师杰夫·迪恩(Jeff Dean)将这两篇论文称之为“语音研究领域20年来取得的最大的一次进步”。但在这一进步的背后,是语音研究领域曾经在过去二十年里停滞不前,突破不大。

全球智能音箱产品出货量预测

技术仍然有待突破,目前机器对自然语言理解尚处于浅层语义分析阶段。科技公司们都没有做到让机器理解人类语言,并实现自然交互。专注于人工智能领域的设计创新公司 FutureForm 的创始人刘梦溪指出,“机器学习大潮暂时没有深入影响语音交互体验,这和技术发展与产品的落地形态都有关。目前的技术本质上是擅长特定场景的弱人工智能(Weak AI/Narrow AI), 而大众期待的强人工智能(Strong AI/ AGI)的完美智能体验,可能还有点远,更不用说被炒得火热的‘情感化交互’了。”

智能音箱的未来似乎也被高估了。“即便 Amazon Echo 已然达到千万级销量及超过 3万项技能点,似乎也不足以成为人工智能时代交互入口的产品担当,”东方证券分析师张颖为声音的生意泼冷水,“1967 年美国著名心理学家、传播学家艾伯特·梅拉比安等人经过大量实验,提出人类在沟通中全部的表达信息=肢体语言信息 55%+声音信息 38%+语言信息 7%。或许这也能在一定程度上解释为何各家智能音箱先后登场,却依然未能挑起入口大梁。”

悲观论调不能阻挡前赴后继的入局者,新的故事还在发生。在第一轮的智能音箱竞争中处于劣势的百度,推出了新的带屏智能音箱。8月8日,百度祭出了低价策略,小度智能音箱降至尝鲜价89元,还可以享受秒杀价8.9元。同一天,百度宣布DuerOS的智能设备激活数量超过一亿。在2018年百度AI开发者大会上,百度智能生活事业群组总经理景鲲表示:“音箱只是大战略中的一环,我们最终想打造的是一个闭环生态,不仅可以输出到音箱上,还可以输出到其他设备上。”在亚马逊之后,谷歌等公司均计划在今年推出有显示屏的智能音箱,这将是语音和视觉相结合的产品。雄心勃勃的创业公司也仍希望挑战巨头:AI公司Rokid在今年1月获得了来自淡马锡等机构的1亿美元融资,今年8月,这家公司推出了rokid.me便携智能音箱,创始人祝铭明告诉《商业周刊/中文版》:“我们不害怕大公司。”

创业公司Rokid除了推出多款硬件产品,还推出了全栈语音解决方案

除了音箱,耳机领域也在发生革命性变化,苹果、三星、谷歌等众多互联网公司正在瞄准这一市场。WiFore Consulting 的报告《智能耳机市场 2016-2020》显示,苹果Airpods 的入场,带来了智能耳机市场的变革,整个智能耳机行业在 2020 年将可能成为一个超过400 亿美元的市场。“智能耳机中语音交互功能的加入,使人们对智能设备的沟通开始从指令性向个人化进行转变。如果说智能音箱是实现远场语音交互的利器,那么在近距离贴身设备的语音交互中,除了传统的手机外,未来的一大表现形式将为智能耳机。”国泰君安发布的研报《智能声学创新开启语音交互新时代》这样表示。

智能语音翻译机也正在如火如荼发展。从最早推出语音翻译机单品的人工智能公司科大讯飞,到搜狗、网易、小米、猎豹等公司,甚至是手机厂商,陆续推出了售价位于几百到上千元之间的翻译机。“有超过50家企业涌入AI翻译机这一市场。大体分为两类。一类是掌握核心技术的企业,无论是机器翻译、离线翻译都是自己打造,比如科大讯飞、百度、搜狗、分音塔等;另一类大多是消费电子领域的硬件公司,依托百度、微软、谷歌等的机器翻译技术落地翻译机产品。”智能硬件媒体智东西发布的《揭开翻译机产业真相》统计。

新的时代刚刚开启。Dave Limp表示具备机器学习、人工智能等技术在内的智能设备的发展将成为未来硬件设备发展的大趋势。在未来的10年,这些硬件设备将以令人难以置信的方式极大地改变人们的生活。“现在还只是处在最开始的位置,”贝索斯在接受音乐杂志billlboard的采访时这样表示,“我们收获了巨大的惊喜,更总是在惊喜上追加重注。”

本文原标题《声音经济学》载于《商业周刊中文版》2018年第16期。

撰文:李好 编辑:范荣靖、孙昊然、周学彦

......

查看原文 >>
相关文章