蔚來眼中的 NOMI 到底能做什麼?數字座艙要朝着哪個方向發展?蔚來開發 NOMI 的過程遇到了哪些挑戰?還有,未來的 NOMI 們將是怎樣的?

1.NOMI > 車載語音助手

2017 年,蔚來發布第一款旗艦 SUV ES8。隨着 ES8 上市,NOMI 成爲全球首個量產的車載人工智能系統。

NOMI 取自英文 Know Me 的諧音,代表了蔚來對車內智能交互體驗的追求——「懂我」。如果你看過科幻電影《Her》,NOMI 就相當於是蔚來版的「Her」。

在蔚來 ES8 和 ES6 開始交付後,NOMI 以智能化、人性化的交互體驗,收穫了一大批車主和蔚來粉絲的喜愛。

許多人認爲 NOMI 就是車內的語音助手,實際上蔚來在 NOMI 上寄予的期望遠超於此。

更少爲人知的是,NOMI 甚至是蔚來展開智能座艙設計的中心。

不少車企的智能座艙設計是以屏幕爲中心,比如拜騰希望通過大屏的設計營造一種坐在客廳交互和娛樂的體驗。而蔚來把座艙前方最中心的位置留給了 NOMI。

以 NOMI 爲中心,蔚來 ES8 上 9.8 英寸的數字儀表屏、11.3 英寸的中控屏和 10 英寸的 HUD 依次展開。

實際上,再加上中控屏下方支持手機無線充電的區域(手機屏),以及 NOMI 本身的屏幕,這 5 塊屏幕就是蔚來數字座艙體驗的基礎。

2.開發 NOMI,難在何處?

蔚來 0001 號員工、負責產品管理的助理副總裁李天舒,在 6 月 5 日「汽車之心·行家說」分享上就講到:

蔚來認爲 NOMI 所在的位置是最能體現一輛車靈魂與核心的位置,而其他的屏幕不追求尺寸最大,而是追求合適和好用,並且其他屏幕在一定程度上都在爲 NOMI「讓位」。

作爲 NOMI 開發過程中的產品經理,他回憶:

當時團隊想到的讓 NOMI 做的第一件事並不是完成複雜的自然語言交互和多輪對話,而是當車主打開車門的那一刻,NOMI 可以把車當成是自己的肌體一樣,感受到有人進入車內了,然後它把頭扭向有人開門的方向,和用戶打個招呼。

「NOMI 與車互爲本體,是車輛與用戶交流的唯一面容和靈魂。」

作爲一個 AI 實體,NOMI 能夠通過聲音、表情、動作來展示虛擬助手無法完成的精微互動。比如當用戶伸手觸碰屏幕時,NOMI 可以把自己的頭稍微低一點,看看用戶想要在屏幕上面做點什麼。當用戶把手收回來,NOMI 的頭又會擡回去。

NOMI 的研發開始於 2015 年,作爲一個過去沒有其他車企量產過的 AI 實體,李天舒說 NOMI 開發過程中遇到了多重挑戰:

第一個問題是 AI 的恐怖谷效應,也就是當 AI 與人在外表或者動作十分相像時,人類會對 AI 產生好感,但同時隨着相似度增加,人們又會注意到 AI 與人的細微差別,而產生恐懼的心理;

第二個問題是車規以及工業設計的挑戰,類似 NOMI 這樣一個幾千元級別的偏消費電子的產品,如何與一輛售價 40 - 50 萬元級別的豪華車相得益彰,外觀上不掉價、不過時;同時這樣的 AI 實體要滿足車規要求,不能在碰撞試驗中增加用戶的安全風險;

第三是 NOMI 有了表情、聲音和動作之後,這些動作如何進行精密同步,這比語音和 TTS(屏幕上的文字)同步,難度要再增加 1 - 2 個臺階。

爲了解決第一個問題,蔚來內部在開發 NOMI 的過程中,從 2015 年到 2018 年很長一段時間內,都要求這個產品不能發出聲音,而只是用表情和一些簡單的(比如嗶哩嗶哩)的聲音來和用戶進行交流,傳遞情感。

NOMI 團隊設計了一整套能夠讓它與用戶進行交流的情感引擎,這套引擎連接起了車輛的底層網關、車機、NOMI 的情感庫以及 NOMI 屏幕的電機驅動器等等,這樣解決了情感互動以及精微動作同步的問題。

NOMI 的工業設計最後選擇了極簡的方式實現一個永遠不過時的產品形象:外觀上團隊選擇了純粹的圓形,並且使用了極簡的符號來做表情包。NOMI 選擇的屏幕規格也相當高,是一塊千萬像素級別的屏幕。

3.取與舍

前面講到,把 NOMI 放在蔚來車輛前方的正中央,讓 NOMI 作爲車輛與用戶交互的中心,從而影響了蔚來車內屏幕整體的佈局和尺寸,這是第一層的取捨。

NOMI 在開發過程中,內部有一個原則是:不顯示功能。

當時蔚來在設計一個疲勞檢測的功能,過去在其他的車上往往會在儀表盤的位置顯示一個小茶杯,那是不是在 NOMI 上也顯示一個茶杯的圖標;或者當用戶在泊車時,用 NOMI 來顯示指引箭頭或者提醒車主掛到 P 檔。

說到這裏,李天舒問了一個問題:「我們有沒有見過在人的臉上去畫一個導航箭頭?」

答案當然是,沒有。

NOMI 的形象是沒有嘴的。這與前面提到的 AI 的恐怖谷效應有關。

這是因爲增加了嘴部後,會導致對話時聲音與嘴型的匹配問題會變得更加複雜。蔚來在嘗試 NOMI 沒有嘴的設計之後,發現反倒是更加和諧、合理的產品形態。

今天 NOMI 的聲音,選擇的是一個相對接近於女性,同時偏中性的聲音。蔚來在這個聲音的挑選上花費了非常大的精力,並且到今天還在持續打磨聲音的品質,其中的要求是能夠實現非常獨特的一個聲音質感。

2018 年,蔚來還發布了 NOMI 的第二款產品 NOMI Halo(第一款產品就是大家非常熟悉的圓形的 NOMI Mate)。

NOMI Halo 利用更簡潔的形式,採用光暈+聲音的形式來和用戶實現語音的互動。

4.輕度劇透:下一代 NOMI

今天的語音技術與 4、5 年前 NOMI 剛剛開始開發時,已經今非昔比。

李天舒談到,未來,NOMI 會更深度地利用多模態交交互的方式,結合車內各種各樣的傳感器,利用視覺、聽覺、觸覺來進行感知,與用戶進行交互。

李天舒眼中 NOMI 的未來,是這幾個詞:第一個會開車,第二個是能懂你,第三個是始終陪伴:

會開車:即自動駕駛;

能懂你:結合視覺、音頻、聽覺、觸覺等多模的方式進行感知和用戶行爲理解;

始終陪伴:針對每一個用戶千人千面的學習,以及用戶體驗的定製化。

如果將這 3 方面的體驗疊加在一起,可以理解爲就是類似「Her」帶來的體驗。

在「汽車之心 · 行家說」的分享裏,李天舒還展示了第二代的 NOMI。

第二代的 NOMI 依然是全圓形的設計,採用了車規級的全圓形的 AMOLED 屏幕,能夠顯示的信息將更加豐富,這樣也能夠允許 NOMI 來展現更多更爲人性化的一面。

最後,NOMI 本身在進化,NOMI 也在通過語音的方式幫助蔚來實現車輛的改進,推動 ES8、ES6 以及後續車型的改進進化。

李天舒提到,到目前爲止 NOMI 已經和用戶對話了 7000 多萬次,每日的對話量在 20 萬次以上,這些的數據量是 NOMI 成長的必要因素。

同時,蔚來可以通過 NOMI 記錄用戶對於車輛的反饋,無論是一些問題改進或者是一些突如其來的靈感。

李天舒說,「其實一個問題發生的場景往往就是在那一個瞬間才最被需要記錄和解決。」

對車主而言,NOMI 恰恰好是一個便利實時的反饋渠道。

在這個渠道上,蔚來已經收集到了用戶上萬條的反饋:比如正在開着自動輔助駕駛,發現一個地方可能體驗並沒有那麼好;或者說突然有了一個靈感,覺得蔚來以後可以這麼幹。

到目前爲止,通過 NOMI 的反饋數量,佔到蔚來整個反饋渠道的 40% 以上。

李天舒說,這個數量級充分證明了,人們其實還是更渴望去跟一個有生命的夥伴去對話,去反饋和進行交互,並且慢慢也會依賴上這樣的一個形式。

相關文章