前幾天我一個遠親老舅來東北探親,我媽爲他接風洗塵。他是我姥姥的姐姐的兒子,按輩分叫表舅,我卻從未見過他。

喫飯時,我對老舅濃重的四川口音很好奇。後來才知道,他的爸爸年輕時就在四川當兵,老舅也生在四川,長在四川,東北話完全不會,普通話也說得不太好,所以我們兩家聊天就特別喜感,我還跟老舅學了好幾句四川話。學是學了,標不標準就不知道了。

老舅已經年過60,雖然文化也不差,但普通話不標準讓他喫了苦頭。他兒子給他買了新手機,教會他用微信跟大家聊天,不過需要打字的時候就磕磕絆絆,拼音輸入法玩不熟練,敲了老半天出不來一句話。於是我跟老舅說,試試百度輸入法的語音輸入,那個AI,也就是機器人,會把你說的話,打成文字,一點兒也不用你費勁摳鍵盤,老舅一聽樂了:我說的四川話你都聽不懂,這機器人能聽得懂?

我笑了笑,給他裝好百度輸入法。長按鍵盤的空格鍵喚醒“語音輸入”界面,之後點擊“普通話”,在彈出的菜單“語種選擇”裏面,切換爲“方言自由說”,然後把手機拿給老舅,“您說兩句試試”。

老舅咳嗽一聲,看到語音輸入那條聲波動了一下,之後,那頗有味道的四川話,就隨着波紋“翻滾”,滔滔不絕起來。

很快,百度輸入法的光標下,一行行準確的文字就輸出來了,與老舅說的四川話完全一致,可以說這“聽聲寫字”的準確度和反應速度,連我自己都驚掉了下巴。現在的AI語音識別,在方言識別這塊兒都做到這麼精準了?

老舅沒看我表情,自己很高興,如獲至寶!他說以前打字,要麼直接微信語音,要麼辛苦地按鍵盤,半句話、一句話的往外發。有這個方法就太好了,以後跟戰友打字聊天,他肯定發的最快!

他很快給他兒子發過去一連串的話,意思是我大外甥教會我一種打字方法,我說的話全能聽懂。他兒子很快回復他,問:是什麼方法啊?

我說是百度輸入法的語音識別,叫“方言自由說”,我按了下語音輸入,這句話也就發了過去。他兒子回覆“謝謝我老弟”,我心裏也美滋滋。

送走老舅,我擺弄手機,才發現最新版本的百度輸入法又升級了,尤其是對方言輸入這一塊兒,爲“方言自由說”新增了河北、昆明、武漢三種方言。還將福建、廣東、湖南、江西、四川、吳語,這些口音較重的地方口音做了升級,使“方言自由說”功能更精準,這樣一來,將會有更多不太會說普通話的中老年人受益,因爲他們也可以拿着手機,通過百度輸入法痛痛快快的“文字交流”了。

百度輸入法從2019年起,就支持多種方言,你不但可以口述普通話、英語、文言文,就算講粵語、四川話、東北話、河南話、山東話、西安話、合肥話、也可以無障礙的語音輸入文字。我也很早就體驗了東北話轉文字,發現百度輸入法這裏面似乎住了個小電腦,你講得啥他都能聽得懂。

事實上,重口音方言精準識別、乃至“方言自由說”的功能,都是建立在百度輸入法先進的語音技術之上。早在2019年,百度就已經發布流式截斷多層注意力建模(SMLTA),將在線語音相對準確率提升15%,並且離線語音識別能力同樣強大。

SMLTA技術也實現了中文在線語音識別的兩個歷史性突破:其一是世界上首次實現了局部注意力建模識別精度超過全局注意力模型,其二是世界上首次大規模部署在線語音交互注意力模型。簡單說就是百度輸入法通過SMLTA技術達到了國內中文語音識別的頂峯,百度語音識別說自己是第二,那麼就沒人敢稱老大。

在這樣強大的語音識別能力之下,百度輸入法又着力面向口音豐富、區別繁雜的中國地方方言,不斷給百度輸入法賦予更“聰明”的頭腦,讓它能精準、快速地識別出不同的中國地方方言,無論是你四川人,還是蘇北人,無論你是不是隻會說粵語、只會說福建方言,都可以在百度輸入法的“聆聽”之後,快速的轉化成你想要寫出的文字。這些真人可能聽不懂的口音,就這樣被百度輸入法的輕鬆解析。我聽說,這就是百度輸入法已經構建成熟的“AI全感官輸入2.0”的冰山一角。

什麼是“AI全感官輸入2.0”呢?簡單講,它就是把之前所說的“方言自由說”等語音輸入方式,鍵盤輸入,以及同樣適合老人使用的手寫輸入法,更好玩的AR表情輸入、動作輸入(一個非常好玩的凌空手寫輸入方法)這些輸入方式的一個合集。“AI全感官2.0”意味着百度輸入法不止可以通過鍵盤、手寫得到你想要輸入的文字,還能將語音、表情、動作融爲一體,帶來好玩又便利的文字輸入體驗。

寫在最後

可以說,百度輸入法的技術提升,不止是紙面上的“世界第一”,也是真真切切地造福大衆,惠及民衆。比如讓中老年人更習慣用手機交流的語音輸入法、方言自由說,還有讓老人們手、腦並用的百度手寫輸入法。

這些靈活、精準、快速的文字輸入方式,讓差一點落伍於時代的老人們有了搭上科技快車的新機會,也讓我們看到了老人們臉上自信的笑容。如果你身邊的大爺、大媽也有文字輸入的難處,就把百度輸入法的語音、手寫輸入法教給他們吧!

相關文章