動口不動手的時代來了!

作爲一名風險投資人,新希望集團華東區投資總監朱光需要時刻注意市場最新動態。除了閱讀之外,他是音頻的愛好者。作爲得到和混沌商學院的重度用戶,他喜歡在早晨邊聽app中的音頻,邊做筆記:“這是最好的吸收資訊的方式。”他五歲的兒子則是喜馬拉雅app的用戶,喜歡收聽英語和唐詩節目。

在他杭州的家中,還有小愛和天貓精靈兩個智能音箱。他不再需要動手,只要口頭下達命令,小愛或天貓精靈就會執行,例如播放音樂、上網購物、單位換算、瞭解天氣預報或星座預測,甚至和他對談,回答問題。

和朱光有着相似消費習慣的人羣數量龐大。喜馬拉雅的用戶規模已經超過4.7億。2017年不溫不火的“千箱大戰”暫告一個段落後,根據調研機構Canalys報告,領先者阿里巴巴推出的天貓精靈和小米的小愛音箱在今年第一季度的銷量分別達到100萬臺和60萬臺,分別位列全球市場的3、4位。基於音頻的內容生態逐漸完善,聲音類新媒體“程一電臺”在2018年8月完成了A輪融資;基於微信公號的聲音媒體“夜聽”也獲得了真格基金的投資。如果五年前的聲音市場仍是音樂播放軟件、傳統音箱等產品的生意,今天隨着語音交互技術的成熟、智能音箱硬件的普及、內容生態的豐富,聲音已是一門大生意。

這是一場新的“權力的遊戲”。正如iPhone的發明和智能手機潮,讓觸控技術成爲主流,帶動了移動互聯網的創新浪潮,聲音的時代此刻正在到來。“這是一個確定的、正在爆發的市場,”聲智創始人陳孝良表示,“隨着語音交互產品的崛起,今天手機的核心地位將被淡化。”在他看來,智能音箱只是現行語音交互和人工智能的一個突破點,未來的語音交互將出現在生活周圍的各個設備。

智能音箱的戰爭並未結束,而是剛剛開始。市場調研公司 Canalys預測,智能音箱在全球範圍內快速普及,預計 2018 年保有量將接近 1 億臺,未來幾年仍將保持快速增長勢頭,用戶量有望在2022年超過3億。行業的入局者既包括阿里、小米等大公司,也有創業公司;在全球範圍內,亞馬遜、Google、蘋果、三星等公司也對這一市場野心勃勃。在中國,較晚起步的手機廠商們正在殺入這一領域。2018年初華爲消費者BG智能家居產品線負責人閃罡就透露道,今年華爲也有望推出智能音箱;在7月份舉行的極客公園 Rebuild 2018 科技商業峯會上,錘子科技創始人羅永浩也向現場觀衆透露,他們也在開發智能音箱。

交互方式的改進,帶來的不僅是便利性的提高,甚至對科技行業產生顛覆性影響。自從愛迪生髮明留聲機以來,人類一直在和機器交談,但目的是爲了與其他人交流,而不是與機器。現在,智能語音市場已經形成了包括底層基礎設施(芯片、傳感器)、中層技術(語音交互、語義識別)、頂層應用(輸入法、娛樂、家居、教育)的完整產業鏈結構。Doppler的前音頻工程主管金茨·克利馬尼斯(Gints Klimanis)在接受《快公司》訪談時表示:“智能手機可能不會完全消失,但是語音命令和聽覺的結合可能會成爲任何自發行爲的主要交互入口。”

重新定義“連接”

從PC時代的鍵盤鼠標到移動互聯網時代的觸屏操控,每次交互入口的演變將帶來一場革命。此刻,全球智能語音市場已經全面爆發,應用場景覆蓋智能家居、車載等多個領域。當語音交互有機會重構未來信息生態和生活,而中國公司第一次獲得有望打造底層技術平臺的機會,重新定義人與聲音、人與語言、人與萬物的連接。“融合語音和肢體動作的交互方式或許更可能成爲下一個時代的主宰,語音顯然會是必不可少的一環。”東方證券分析師張穎這樣表示。背靠十億消費者市場、日趨成熟的軟硬件技術環境,中國科技公司們正在迎來新的浪潮。

2016年,陳孝良決定從中科院辭職時,他一度感到糾結。他所供職的聲學所,是一個冷門機構,大多數畢業生都流向了軍方或科研機構。在中科院工作多年的陳孝良,最終決定離職創辦了一家聲學與語音智能公司,它能從底層聲學技術入手,爲進入這一領域的公司提供智能音箱的解決方案。

聲智創始人陳孝良

出乎他意料,生意很快迎來了爆發:2017年年初在美國拉斯韋加斯舉辦的CES,讓中國科技公司們注意力第一次放到了亞馬遜身上—這家公司推出的Echo音箱獲得了超過500萬銷量。“Echo代表着智能語音交互產品第一次獲得了規模化銷量,並得到了消費者們的認可。”但在陳孝良眼裏,不少找上門來、渴望在語音市場裏獲利的中國公司並不具備技術研發基礎和打造消費級產品的能力,“這是一個入門容易,深入難的市場。智能音箱考驗的是一家公司用戶觸達能力、語音與AI 技術、生態整合能力等多重實力。”

不會撒謊的市場

市場很快變得瘋狂。從互聯網公司、傳統音箱公司到家電公司、DVD公司,嗅覺敏銳的中國公司聞風而動。2017年新媒體智東西曾發表文章指出,全世界80%以上的音箱由深圳生產,然後出口到海外各地。圍繞着對外貿易,深圳匯聚了龐大且複雜的產業鏈集羣,福永、沙井、龍崗幾個地區棲息着上千家中小音箱代工廠,匯聚着數十萬工人,他們處於產業鏈的最底端,賺着最微薄的辛苦錢。

市場最終如陳孝良所預料:被有消費者號召力的公司所收割。上百款智能音箱推出後,反響平平。目前的市場領先者是天貓精靈和小愛同學。這兩款產品的特點之一是價格位於百元區間。科技巨頭豐富的產品線、極具競爭力的定價策略、突出的技術實力等,正在使後進入者難以追趕。

隨着第一波想賺快錢的公司出局,戰爭並沒有結束,而是進入了深水區。2018年第一季度,Canalys表示智能音箱銷量同比增長了210%。中國市場之外,全球科技巨頭們正在爲價值數十億美元的智能音箱及其背後的市場繼續搏鬥。和阿里、小米的策略類似,這些公司均採用激進的定價策略,將銷量視爲最核心的目標之一。“在巨頭補貼的情況下,也許明年買一臺智能音箱補貼消費者十塊錢的情況都可能發生。”出門問問創始人李志飛曾這樣表示。

智能音箱開始分流手機用戶。中信證券研報《智能語音:快速崛起的人工智能入口》顯示,語音助手具有較好的用戶黏性,同時用戶對語音助手的使用對智能手機、pad 等現有設備已具有顯著的替代和分流作用。

AI與聲音

智能音箱只是檯面上的狂歡,各大廠商們爭奪的是移動互聯網之後的稀缺入口。“在即將到來的萬物互聯時代,次類型的入口以及語音交互的形式極有可能會成爲主流。”國泰君安發佈的報告《智能聲學創新開啓語音交互新時代》這樣表示。比智能音箱更有價值的是支撐其服務的開放平臺,如支撐Echo設備運行的是亞馬遜開發的Alexa平臺,目前開發者基於Alexa開發的應用技能已超過45000種。打造智能語音生態等的同時,各大公司也通過智能語音技術能力的開放,提升自身在行業市場的參與度,比如百度 DuerOS、科大訊飛等國內巨頭均開放了語音識別、語義分析、語音合成、計算機視覺等基礎 AI 能力。

全球科技公司對語音技術的研發投入從未停止。從 1970 年代起,語音助理(Virtual Personal Assistant)產品就已經陸續面世。然而,軟硬件的技術不成熟導致這一領域並未成爲值得開墾的富礦。2001年,計算機語音識別達到了80%的準確度,但這一準確率仍不足以讓語音提供比鍵盤更高效的交互效果。技術實現突破的原因在於AI 技術。過去主要依靠算法的進步和樣本的積累,隨着深度學習算法的出現,語音識別的準確率有了明顯的進步,目前語音識別引擎已經達到95%的準確度。此外,硬件端麥克風陣列解決遠場語音交互難題,除了聲智,訊飛、思必馳等國內供應商也推出了諸多麥克風陣列解決方案。

全球智能語音產業規模快速增長&中國智能語音產業規模增速顯著高於全球市場

分析師們看好語音的崛起,認爲這是科技發展的必然。中信證券分析師徐英博表示:“人類人機交互的過程,大致經歷了從人適應智能計算設備到設備適應人的過程,從早期黑白文字界面、到圖形用戶界面,以及目前的多點觸控、語音會話等,人機交互方式的演進伴隨着交互自然性、承載的信息量持續改善。智能語音的出現,推動人機交互方式更爲順暢、自然和富有效率,其發展遵從人機交互方式不斷進化的客觀規律,具有歷史必然性。”

交互世界

語音交互涉及了複雜的技術鏈條,包括了聲學處理、語音識別、語義理解和語音合成等核心技術。隨着人工智能、聲學等技術的發展,語音交互的技術難關正在被攻破。智能語音作爲 AI 平臺性技術,向下實現 AI 底層運算能力調用,向上和應用場景融合,和計算機視覺等類似,是 AI 重要入口。當前智能語音已在個人用戶領域,以及金融、醫療、教育等行業市場得到廣泛應用,並承擔在線客服、電子病歷轉錄、個人助理等功能,推動人機交互,顯著提升業務效率。

“交互方式的改進,如果只是帶來純粹的便利性,那就只是一個更好的功能,但如果這種交互方式影響了信息的整合與輸出方式,那就會對行業產生顛覆性影響,”聲智科技副總裁李智勇在虎嗅專欄文章《想成爲下一個BAT,還得搞語音交互》中這樣表示,“從現象上看,最直接的影響是app會消失。”他解釋,語音交互意味着更加大一統的科技格局,因爲用戶不用打開app同時也不會再有和瀏覽器相併列的大客戶端,所做的只是輸入一句話。

語音交互的開路先鋒亞馬遜就認爲,自己所創造的Echo設備與過去通過Pad或者手機能獲得的服務完全不同。Echo 於 2014 年 11 月正式推出,產品測試階段僅提供給少數客戶購買, 2015 年正式上市後擴大至全美客戶。 亞馬遜全球設備與硬件的負責人Dave Limp告訴《商業週刊/中文版》:“過去的設備需要消費者通過鼠標、鍵盤、屏幕與之交互,這種交互只侷限於一對一的形式,消費者與計算機的交互就留在了某一臺機器上,不會到任何地方,也不能跟其他任何用戶去分享。而Alexa和Echo作爲一款全新的產品和服務,人機界面是完全不同的,讓人感覺更親和,可以讓用戶感覺它隨時都在。因爲Echo隨時可用,用戶可在房間內充分信賴它,比如設置廚房計時器、播放悅耳的音樂,甚至檢查孩子的作業,這就變成了更親密的人機關係,讓它變成消費者生活中的一部分。”

亞馬遜創始人傑夫·貝索斯(Jeff Bezos)是《星際迷航》的骨灰級粉絲,Echo的發明來自《星際迷航》的啓示。“我們用機器學習算法爲網站用戶做產品推薦,取得非常好的效果,消費者非常喜歡。當時我們在內部就對工程師說,在什麼領域我們還可以更多地應用人工智能與機器學習算法,能夠更好地讓消費者獲益?後來我們的團隊就提出一個想法—如果我們能夠把雲提供的沒有限制的計算能力,與機器學習和人工智能這兩者結合在一起,那麼會創造出一種類似《星際迷航》中的隱形電腦一樣的設備。”Dave Limp這樣表示。

亞馬遜智能交互音響Echo

在《星際迷航》的宇宙飛船中,無論站在宇宙飛船的哪一個位置,都可以隨意地發問,隱形電腦都可以找到答案。Dave Limp 說:“Echo產品本身是非常簡單的,售價只有50美元左右,背後是Alexa,擁有巨大雲計算能力和海量的知識,這是我們實現打造《星際迷航》隱形電腦的第一步。”隨着Alexa的發展,其技能越來越廣泛,除了購物、打車、控制電器等功能外,還有新聞、遊戲、教育等方面的技能。

語音交互在中國

但不可諱言,亞馬遜和谷歌並不是中國市場裏強有力的參與者,這讓中國科技公司在這一領域獲得了更多機會:這一次,不僅是可以賣出更多產品,而是有機會打造一個底層技術平臺。在中國,最類似亞馬遜 Alexa + Echo 模式的是阿里及其推出的 AliGenie + “天貓精靈”組合,阿里選擇了一條從語音平臺到硬件產品全部由自己打造的路線。AliGenie 開發者平臺,主要面向四種類型的開發者,包括內容開發者、應用開發者、智能家居開發商和硬件生產商。開發者既可以創建技能,爲更多的語音用戶提供服務,也可以將自己的設備接入雲端服務,獲取語音交互能力。

百度和騰訊也是市場的積極參與者。百度曾以千萬美元的價格收購智能音箱創業公司“渡鴉”,推出Raven H後,渡鴉創始人呂騁已於2018年7月離職。目前,百度主推產品爲小度智能音箱,騰訊則自主研發了聽聽AI音箱。

互聯網巨頭智能語音產品佈局

落地艱難的智能家居也有望藉助智能音箱而得以突破。現階段,Echo、天貓精靈、小愛同學等產品均實現了家居控制功能。在“天貓精靈”的淘寶店鋪上,除了銷售音箱,還銷售智能燈泡、插座等產品,通過智能插座和紅外遙控,可以遠程控制超過20000款傳統家電。根據艾瑞諮詢的數據顯示,2016 年智能家居穿透率普遍不超過 5%,例如門鎖 3.5%、照明系統 2.1%、洗衣機 1.8%、冰箱 1.1%,到了 2020 年預計各環節智能化滲透率都將超過 20%。中國智能家居市場規模也將在未來幾年保持超過 50%的增速,預計到 2020 年將達 3294 億元。

過去,中國人被認爲並不是聲音消費的愛好者,由於缺乏使用音箱的客廳文化,音箱一直是市場上的小衆產品。然而,在《麻省理工評論》看來,中國是發展語音接口的理想市場。調研機構Canalys發現,中國市場的智能音箱發展速度遠超全球。早在智能音箱市場發展之前,中國消費者曾經接受過一輪普及:2012年前後,Wi-Fi音箱開始在國內興起,聯網後可以播放流媒體音樂等內容。現在,音箱所能支撐和兼容的服務數量與質量成爲競爭核心。看上去,這是一個必然由大公司主宰的領域。中信證券分析師徐英博認爲,隨着物聯網基礎設施完善,智能語音平臺中長期具有和當前手機 OS 極爲類似的戰略重要性,作爲平臺屬性突出的產品,其發展依賴於平臺商、硬件商、內容&服務商等的共同參與,其運作模式類似於操作系統的典型生態模式,這也客觀上決定了這必然是巨頭主導的市場。

競爭不斷

巨頭環伺的智能音箱市場格局仍在不斷變化。目前,谷歌的智能音箱Google home正在飛速趕上。Strategy analytics公司預測,亞馬遜的全球市場份額從過去一年76%下降到了41%。“在智能音箱這個飛速變化的市場上,沒有一家公司可以長期處於統治地位,如果有公司可以,也許會是谷歌。”

“聲音的生意就只是智能音箱嗎?顯然不會,”陳孝良說,“亞馬遜成功地開掘了智能音箱的潛力。中國公司爲什麼只能亦步亦趨地跟隨式創新?我們有市場、有技術,應該去創造更多的產品,而不是等其他公司成功後再去模仿。”回顧Echo的發展歷程,其問世並不起眼。Dave Limp表示,當初剛剛推出Echo的時候,它的功能非常少,在將Alexa平臺接口開放後,成千上萬的開發者被吸引,基於Alexa開發出上萬種功能和應用,這吸引了更多的用戶、更多的開發者、更多的應用和功能等。

智能語音背後的三類核心技術

智能音箱僅是語音交互時代的第一個標杆產品。“語音交互具有強大潛能,能帶動全球智能鏈條的創新。智能音箱只是一個很好的突破點,將來肯定會衍生出衆多的應用,甚至重構整個消費電子行業。”陳孝良這樣表示,“語音是天生的人機交互入口,就像人和人之間用語言交流是很自然的事情,未來人類和機器之間直接用語言交流也將成爲同樣自然的事情。”

他明白自己的麥克風陣列技術方案面對的是企業客戶,創新的核心仍在平臺和硬件產品廠商層面:“每個技術興起的時候都是沿着技術紅利到產品紅利到模式紅利的路徑。我們的技術是基礎,讓硬件商們可以發揮想象的基本的空間。就像我給你顏料和畫筆一樣,但是核心絕對不是顏料和畫筆。”重要的是基於技術的創造力,他強調。

擴張的硬件,不變的市場

語音優先的硬件層仍在快速擴張。即將入局者有華爲、facebook、松下等公司。市場研究機構Maximize Market Research報告顯示,2026年全球智能語音市場預計將達到188.4億美元,在2017年至2026年期間的年複合增長率爲32.67%。研究諮詢公司Ovum預測,2021年搭載智能語音助手的設備數量將超過75億臺,比當今世界的人口數都要多。

在硬件和底層技術平臺快速崛起時,中國的音頻內容生態圈經過多年的發展,也走到了成熟期。

喜馬拉雅創立時處於一個不利的市場環境裏。2012年,餘建軍與搭檔陳小雨創業前曾經想過做幾個不同的項目,但最後定下來做音頻。他的上一個項目“那裏世界”,因爲經營不順,100多個員工只剩8個。在艱難的時候,餘建軍每天都聽馬丁·路德·金的演講,“只要聽幾句話,就好像充滿電了。”當時,他的核心邏輯是覺得,因爲移動互聯網,音頻是未來趨勢,可以觸達過去媒體沒法觸達的場景,比如開車、擠公交地鐵、跑步、做家務等。喜馬拉雅由此成立。然而,這一領域的未來並不被看好。2012年,正當餘建軍創業時,李開復恰巧發表了博文《語音微博是個僞命題》,業界的主流觀點是不看好音頻的未來。

音頻內容的未來,被當時的人們低估了。走過了不被接受的探索階段,如今,喜馬拉雅的宣傳文案是:“每條聲音聽一遍,600年才能聽完。”臺灣資深配音師周震宇,關注到大陸音頻app的快速發展,他成爲了蜻蜓app上的簽約主播。他是廣告、紀錄片背後的配音員,十年前,他轉行成爲了一名“聲音教練”,幫助需要對外發言的配音員、主播、企業發言人等客戶做口語表達教育訓練。現在,除了線下教學,他發現自己也熱愛上了錄製音頻課程。

除了蜻蜓、喜馬拉雅等產品,周震宇還是得到app上“精英日課”的忠實用戶。最讓周震宇驚訝的是大陸音頻app上驚人的播放量。在喜馬拉雅上,“曉說2018”欄目播放量已經達到7.3億,主播“丸子”錄製的網絡文學《超品相師》有聲書總播放量超過20億。和周震宇相似的內容提供者已有百萬量級。最新數據顯示,喜馬拉雅目前總用戶規模突破4.7億,平臺內共有500萬主播,其中包括20萬名認證主播,活躍用戶日均收聽時長超過135分鐘。除了國內市場,喜馬拉雅還擁有超過3500萬海外用戶。

“聲音最大的魅力在於陪伴”

衆多內容提供者並不是和周震宇一樣出身科班。喜馬拉雅上名爲“軒林”的主播今年纔剛滿20週歲,初中肄業。在朋友的介紹下,誤打誤撞成爲了一名主播,因爲錄書,他曾經睡過兩年行軍牀;爲了音質效果,在炎熱的夏天悶在一個小屋裏而不敢開電扇。現在,他是一個擁有近60萬粉絲的主播。在這個平臺上,4S店銷售、工程師、大學生都能獲得機會。只要有一個麥克風、一臺電腦、一個聲卡,即使位於偏遠城市,一個主播仍然可以通過聲音和成千上萬的用戶連接。除了草根主播,電視臺、廣播電臺、培訓機構都是音頻app上內容的來源,歐萊雅、肯德基等品牌也入駐了喜馬拉雅,在平臺上和消費者進行溝通。

在語音商業生態中,除了硬件和底層平臺,內容平臺和內容生產商是頂層應用裏的重要一環。在中國市場,喜馬拉雅FM已經逐漸搭建起來一套商業變現體系,通過廣告、知識付費以及直播等形式,讓入駐的主播們以及平臺都能獲得收益,餘建軍將這種模式形容爲“聲音的淘寶”。2017年,喜馬拉雅推出了智能音箱“小雅”,完善音頻生態的佈局。商業化探索讓這家公司成功打造了音頻創業生態圈,形成了用戶、內容商和平臺的互動。除了喜馬拉雅,音頻平臺在未來發展方向上存在差異化競爭,荔枝、蜻蜓等平臺方在2018年先後獲得了融資;2018年6月有聲閱讀平臺“懶人聽書”,近日完成C輪2億元融資,由上市集團時代出版、前海天和、孚惠成長共同領投。

音頻內容生產商也受到資本的垂青。2014年5月成立的程一電臺,在今年8月宣佈獲得A輪融資。根據新榜報道,程一全網播放量累積超過25億,而全網粉絲已經超過1200萬。和程一電臺類似的還有微信公號“夜聽”,這家公司的微信聽衆累計達到2500萬,在2017年獲得了來自真格基金的投資。此外,樊登讀書會、科學隊長等有聲書、音頻直播等領域的頭部公司也在近期獲得融資。

“聲音最大的魅力在於陪伴。音頻可以在很多無法使用視頻、文字的場景下使用,”周震宇認爲音頻內容領域仍將有很大發展空間,“它滿足了人們碎片化時間的娛樂和知識需求。”在音頻app上的收入,他需要和經紀人進行分成。對於現在的收益,他認爲還有很大的提高空間,不過他認爲自己最在意的不是錢,而是口碑,“我希望它成爲經典的內容。”

當商業機會在向頭部應用集中,希望在音頻應用中獲得機會的創業公司需要轉向和智能硬件的結合。創豐資本投資人胡蕤認爲,移動音頻平臺仍是產業鏈的核心環節。但移動音頻內容生產與智能硬件領域也在逐漸升溫,未來將於可穿戴設備、智能家居和車載硬件等諸多場景中得到應用。

在科幻電影《Her》當中,男主人公和智能語音系統“薩曼莎”發生了一段感情故事。人類既恐懼於機器可能擁有的不可控力量,又期待機器擁有更強智能和情感交互能力。

語音識別技術歷史

1997年,MIT媒體實驗室Picard教授提出了“情感計算”的概念。“許多人普遍認爲計算機的情感是一種空洞無聊的東西,就像蛋糕表面上的一層糖霜,可以用來使之更爲悅目,但沒有真正實質上的意義。實際上,計算機通過對人類的情感進行獲取、分類、識別和響應,可幫助使用者獲得高效而又親切的感覺。”他分析。

只是,目前的設備和軟件均不能做到這一點。朱光對家中的天貓精靈、小愛同學的表現並不滿意,“只是把它們當播放器使用。”大同小異的產品,並沒有給用戶帶來新鮮體驗。他認爲,所有的設備都將“聽得到”和“聽得懂”用戶在說什麼,然後去執行相應任務—這個美妙的未來,似乎並不會那麼快到來。

困難重重

無法多輪對話、對話生硬的問題仍存在。根據彭博新聞社報道,2012年,谷歌和多倫多大學的研究人員發表了一篇頗有影響力的論文,內容關於使用“深度神經網絡”在電腦中模擬語音。幾個月後,微軟和IBM合作發表了另外一篇論文。谷歌工程師傑夫·迪恩(Jeff Dean)將這兩篇論文稱之爲“語音研究領域20年來取得的最大的一次進步”。但在這一進步的背後,是語音研究領域曾經在過去二十年裏停滯不前,突破不大。

全球智能音箱產品出貨量預測

技術仍然有待突破,目前機器對自然語言理解尚處於淺層語義分析階段。科技公司們都沒有做到讓機器理解人類語言,並實現自然交互。專注於人工智能領域的設計創新公司 FutureForm 的創始人劉夢溪指出,“機器學習大潮暫時沒有深入影響語音交互體驗,這和技術發展與產品的落地形態都有關。目前的技術本質上是擅長特定場景的弱人工智能(Weak AI/Narrow AI), 而大衆期待的強人工智能(Strong AI/ AGI)的完美智能體驗,可能還有點遠,更不用說被炒得火熱的‘情感化交互’了。”

智能音箱的未來似乎也被高估了。“即便 Amazon Echo 已然達到千萬級銷量及超過 3萬項技能點,似乎也不足以成爲人工智能時代交互入口的產品擔當,”東方證券分析師張穎爲聲音的生意潑冷水,“1967 年美國著名心理學家、傳播學家艾伯特·梅拉比安等人經過大量實驗,提出人類在溝通中全部的表達信息=肢體語言信息 55%+聲音信息 38%+語言信息 7%。或許這也能在一定程度上解釋爲何各家智能音箱先後登場,卻依然未能挑起入口大梁。”

悲觀論調不能阻擋前赴後繼的入局者,新的故事還在發生。在第一輪的智能音箱競爭中處於劣勢的百度,推出了新的帶屏智能音箱。8月8日,百度祭出了低價策略,小度智能音箱降至嚐鮮價89元,還可以享受秒殺價8.9元。同一天,百度宣佈DuerOS的智能設備激活數量超過一億。在2018年百度AI開發者大會上,百度智能生活事業羣組總經理景鯤表示:“音箱只是大戰略中的一環,我們最終想打造的是一個閉環生態,不僅可以輸出到音箱上,還可以輸出到其他設備上。”在亞馬遜之後,谷歌等公司均計劃在今年推出有顯示屏的智能音箱,這將是語音和視覺相結合的產品。雄心勃勃的創業公司也仍希望挑戰巨頭:AI公司Rokid在今年1月獲得了來自淡馬錫等機構的1億美元融資,今年8月,這家公司推出了rokid.me便攜智能音箱,創始人祝銘明告訴《商業週刊/中文版》:“我們不害怕大公司。”

創業公司Rokid除了推出多款硬件產品,還推出了全棧語音解決方案

除了音箱,耳機領域也在發生革命性變化,蘋果、三星、谷歌等衆多互聯網公司正在瞄準這一市場。WiFore Consulting 的報告《智能耳機市場 2016-2020》顯示,蘋果Airpods 的入場,帶來了智能耳機市場的變革,整個智能耳機行業在 2020 年將可能成爲一個超過400 億美元的市場。“智能耳機中語音交互功能的加入,使人們對智能設備的溝通開始從指令性向個人化進行轉變。如果說智能音箱是實現遠場語音交互的利器,那麼在近距離貼身設備的語音交互中,除了傳統的手機外,未來的一大表現形式將爲智能耳機。”國泰君安發佈的研報《智能聲學創新開啓語音交互新時代》這樣表示。

智能語音翻譯機也正在如火如荼發展。從最早推出語音翻譯機單品的人工智能公司科大訊飛,到搜狗、網易、小米、獵豹等公司,甚至是手機廠商,陸續推出了售價位於幾百到上千元之間的翻譯機。“有超過50家企業湧入AI翻譯機這一市場。大體分爲兩類。一類是掌握核心技術的企業,無論是機器翻譯、離線翻譯都是自己打造,比如科大訊飛、百度、搜狗、分音塔等;另一類大多是消費電子領域的硬件公司,依託百度、微軟、谷歌等的機器翻譯技術落地翻譯機產品。”智能硬件媒體智東西發佈的《揭開翻譯機產業真相》統計。

新的時代剛剛開啓。Dave Limp表示具備機器學習、人工智能等技術在內的智能設備的發展將成爲未來硬件設備發展的大趨勢。在未來的10年,這些硬件設備將以令人難以置信的方式極大地改變人們的生活。“現在還只是處在最開始的位置,”貝索斯在接受音樂雜誌billlboard的採訪時這樣表示,“我們收穫了巨大的驚喜,更總是在驚喜上追加重注。”

本文原標題《聲音經濟學》載於《商業週刊中文版》2018年第16期。

撰文:李好 編輯:範榮靖、孫昊然、周學彥

......

查看原文 >>
相關文章