人們日常出行越來越依賴地圖進行導航指路、查路況以及找附近興趣點。而用戶在開車途中用手操控或視線瀏覽屏幕,具有很大的安全風險。語音助手的出現極大解放了駕駛過程中用戶的手眼,提升駕駛安全性。它不僅支持全程語音喚醒,還能快速精準理解用戶指令,提出有效解決方案。

https://v.qq.com/x/page/g31099vg7o9.html

1 語音助手概念

語音助手是指在硬件設備或APP軟件上植入人機對話程序,輔助用戶通過語音方式使用宿主設備或程序上的功能。完整的人機對話包括聲音信號的前端處理、將聲音轉爲文字供機器處理、在機器生成語言之後,用語音合成技術將文本語言轉化爲聲波,從而形成完整的人機語音交互。

2 語音助手體驗趨勢

AI技術的發展以及硬件升級,賦予智能設備越來越多感知通道,也不斷增強通過各種媒介進行信息輸出的能力。感知和輸出層之外,情感計算能力的提升使機器在認知層得到質的飛躍。它們遠比之前更懂用戶,也遠比之前更會表達。基於設計理解與實踐,我們認爲語音助手體驗在交互通道、交互對象方面正呈現三個趨勢:

2.1 信息服務的表達融合多通道體驗

2.2 對話貼近人的自然本能

2.3 具備情感交互能力

2.1 信息服務的表達融合多通道體驗

除語音通道外,AI計算機視覺技術拓展了人臉、隔空手勢等交互通道,而傳統觸控、旋鈕等交互方式在操作精度、信息輸出效率以及技術成本方面還有自身優勢。多通道融合能發揮不同通道的優勢和場景適用性,對信息服務的表達更自然,效率最大化。

2.1.1 地圖語音交互形態重構

基於觸屏手機設備的地圖語音,視覺信息的協同輸出能有效彌補語音無形、線性、不易記憶等缺陷,增進用戶對語音交互體驗的理解。在近場交互時,觸屏還支持信息快速回復。

形態是地圖語音不可或缺的重要通道。

初次引入語音交互能力,爲了減少認知成本,地圖語音的交互形態沿用業界通用的封閉式對話流。而這種形態也隨着語音支持的地圖功能擴展而產生侷限性:

(1) 形態獨立封閉且與場景不融合,會對導航產生干擾,影響駕駛安全。

(2) 不能利用地圖原有的信息表達,需要在對話流中單獨呈現結果。不僅影響算路等複雜需求的拓展,還會增加設計與開發的維護成本。

爲真正適合地圖場景,語音助手形態完成向非模態、任務伴隨式面板的重構:利用地圖原有的信息功能做展示,同時支持語音和觸控兩種回覆方式,提升多輪對話效率。區別於封閉式對話流,伴隨式面板不跳脫當前場景,帶給人更輕量的感受。

語音形態的簡化在一定程度削弱了語音狀態的表達,爲了確保用戶對語音狀態的強感知,面板信息框架的頭部在語音進程中持續展示小度頭像動效和文案提示。

2.1.2 地圖語音結果VUI與GUI協同

在檢索地點等任務場景中,用戶通常注重效率。VUI結果話術的設計首先以目標爲中心爲原則,在精確檢索單個結果時,引導用戶進行下一步行動;而在模糊檢索有多個結果時,向用戶詢問選擇或推薦可能最感興趣的地點並引導行動。

配合VUI話術,GUI也做相應的協同展現:數字序號匹配VUI的問詢和用戶選擇,而推薦結果的高亮和標籤使VUI推薦地點映射GUI,增強結果的表達效率。

2.2 對話貼近人的自然本能

連續對話且可隨時打斷,符合日常交流本能意識,但目前絕大多數產品語音交互仍不夠自然:發起對話需要在安靜環境下,先喚醒再發出指令,並且以“一問一答”爲主。隨着全雙工免喚醒等語音技術的出現,通過上下文信息對用戶指令的預測和判斷,可以免去中間喚醒環節,實現更爲自然流暢的多輪對話。

在實現自然對話前,有效的認知教育是降低用戶使用語音門檻的必經途徑。

2.2.1 地圖語音認知教育體驗創新

由於語音信息“隱形”特性,存在技能可發現性弱的缺陷,導致用戶時常忽略使用。同時,經地圖語音基礎調研發現,不習慣操作方式是用戶不使用語音的首要原因。

地圖語音基礎調研_不使用語音原因

語音技能在不斷擴充的同時,需要解決如何增強語音可感知,加強用戶學習並培養使用習慣。入口觸達和場景化引導是增強語音可感知必不可少的手段:在用戶未形成語音喚醒習慣時,入口作爲用戶在觸屏感知功能的意符必不可少,而它還是語音喚醒效果不佳時的有效補 充。另外,語音作爲自然高效的交互模式,需要基於語音優勢場景強化引導,激發使用動力。

技能中心是進行語音集中用戶教育的特有場所。市面上絕大多數產品的技能中心,都是以說明書的文本方式進行教育,本質上仍是閱讀爲主。而認知研究表明,而我們的大腦爲語言而非閱讀而設計。說話和理解口頭語言是自然的人類活動,但閱讀不是。爲了追求最真實的學習效果,地圖語音通過線上真實環境以聽說的方式完成沉浸式新手教育。

在用戶的心智模型裏,語音的工具概念決定了用戶在有意圖時纔會使用,這對學習以及習慣養成所需的實踐頻次和規律性都難免造成影響。因此,地圖語音技能中心提出小度成長概念,完成每日任務,用獎勵幫助小度成長,用戶在潛移默化之快速學習技能,培養使用習慣。任務主要在個性化、熱度、等級等維度進行組織,比如個性化方面,優先展示用戶容易出錯的指令任務,通過反覆學習解決指令的表達問題。

2.3 具備情感交互能力

語言是人類智能的象徵,用戶對語音產品會產生“移情”效應。情感計算可以使產品通過情緒分析等機器學習算法處理相關數據,如人的面部表情、肢體動作以及各種心理參數:心跳、脈搏、腦電波等,結合外界環境信息,最終計算出人的情感狀態。再從硬件層面、GUI及VUI層面給予立體的情感反饋,實現情感交互。

當前地圖語音主要基於導航駕駛環境的數據來主動提供服務與建議。

2.3.1 地圖語音主動服務

地圖語音主動服務當前主要包括安全建議、路況以及目的地服務等三個主要場景。比如在用戶高速長時間駕車時,提供最近休息服務區;路段出行擁擠時,建議合適路線;而在臨近目的地時推薦方便停車點。在駕車過程中的關鍵觸點提供有價值的主動服務,提高駕駛安全性,建立可信任的情感聯繫。

隨着未來透過更多傳感器來獲取人體相關數據,能準確把握用戶情緒狀態,在導航中提供有利於情緒安撫和安全駕駛的主動服務。

寫在最後

AI時代,語音助手本身將有機會成爲唯一的服務主體而存在。

受益於語音能力的進一步進化,信息與服務圍繞用戶而非介質持續流動。人對自然、情感、個性化的訴求比以往任何一個時代更爲凸顯,語音體驗將更加實時多變。進化的另一面,用戶隱私與商業競爭將會影響這一理想願景的實現。

參考:

[1] 《2020年中國智能語音行業研究報告》

[2] 《2019AI人機交互趨勢研究》

Powered by Froala Editor

相關文章