中國語言文化源遠流長,方言衆多,爲了溝通方便,我們生活中會盡量使用普通話,不過夾雜“南腔北調”的不同口音依然會造成現實中的交流困惑。爲此,百度輸入法憑藉領先的AI技術升級現有的語音識別功能,開發出可聽懂多地方言的“方言自由說”,精準識別重口音普通話,讓日常聊天寫作的文字輸入速度快到飛起,即使普通話水平有限的老年人也能流暢使用,成爲目前支持AI全感官輸入方式最爲友好的輸入法。

相較鍵盤和手寫輸入,解放雙手的語音輸入有更廣闊的發展空間,駕車時說出目的地就能導航,遊戲中打字無需費時手工鍵入,就連文稿也可以口述轉寫,如此便利的語音輸入不僅老人喜歡,年輕人也逐漸依賴。而語音輸入法發展並非一帆風順,至今仍有環境降噪、方言、功能單一等問題有待解決,若想佔據手機端高頻率輸入方式,唯有依託強大的研發實力和技術支撐。

百度輸入法之所以成爲行業翹楚,憑藉的是其擁有世界領先的語音技術,早在2019年,百度發佈流式截斷多層注意力建模(SMLTA),將在線語音相對準確率提升15%,超越行業最優競品15%,可提供準確率超過98%的語音輸入服務,並且離線語音的識別精準度也已達到在線語音同樣水平,用戶在無網絡的情況下也能流暢使用語音輸入,解決了常規語音輸入法經常被吐槽的斷網假死情況,極大地拓寬了語音輸入使用場景。

此外, “全感官輸入2.0”的概念也是百度輸入法率先提出,一機可集成鍵盤輸入,語音輸入、手寫輸入、表情輸入(AR表情)、動作輸入(凌空手寫)等多種輸入方式,爲用戶帶來多元化“全感官輸入”的AI輸入體驗。而此次推出“方言自由說”可以看作是 “全感官輸入2.0”持續完善的成果體現,“方言自由說”內新增河北、昆明、武漢三種方言,對原先支持的福建、廣東、湖南、江西、四川、吳語等口音普通話也作了大量升級,能夠精準識別口音更重的普通話。可以說在輸入法行業裏,將語音識別玩得最溜且有深度的只有百度輸入法。

那麼如何開啓語音輸入功能呢?方法很簡單,在任意輸入界面下長按空格鍵可進入語音輸入面板。開啓語音輸入功能無需改變日常鍵盤使用習慣,其操作是極爲便捷的,並且該界面有所需的語種選擇功能,包括普通話、中英自由說、方言自由說、中譯文言文、粵語、四川話、東北話、河南話、山東話、西安話、合肥話、英語、日語、中日韓互譯都在一個菜單中,其語音識別不僅支持幾乎所有國內地域方言,有了百度輸入法的加持,智能手機可搖身變成一臺翻譯準確率和速度可媲美專業產品的翻譯機,例如說出中文,屏幕上會根據選擇顯示英文、日文或是韓文,如此便捷的零費用翻譯軟件,必然會成爲生意洽談、旅遊時更爲經濟實用的翻譯利器。

當然,百度語音輸入法的功能不僅於此,還有非常多的亮點技術在內,其中令人深刻的代表有語音速記、語音互益、語音指令、長文本語音輸入等功能。相比很多按字節收費的語音轉寫工具,百度輸入法直接砍去了語記計費門檻,不僅零費用,而且語音速記支持單人和多人模式。其技術特點是語音轉換爲文字的速度更快,在多人模式下可通過聲紋識別自動標識不同的發言人,爲後期稿件的校對減少很多整理環節,節省珍貴的時間成本。

更有趣的應用當屬語音鬥圖功能,顧名思義,只要說出想表達的大概意思便會出現語義相關的鬥圖表情包,開啓的方法是在語音輸入界面點擊“鬥”字圖標,隨後用語音說出關鍵詞,例如“打你”,輸入法的顯示框會出現諸多相關的搞笑表情包,用來聊天鬥圖可免去手動收集之苦,出口成圖,用速度和量級碾壓對方。

令人意外的是百度輸入法內引入了"小度"智能語音助手,並讓“小度”充當了文祕。“小度”的權限很大,除了刪減增添文字,還可以進行文檔內的批量操作,以及執行更多在智能音箱端的類似語言指令,可撥打電話、查詢號碼、諮詢天氣等等,有了“小度”加入,手機智能X2,一句話可讓工作變得輕鬆高效。

爲了提高識別準確率,百度輸入法內置了場景化識別引擎,能夠針對不同應用採用對應識別引擎。例如在地圖類APP中會關聯搜索地名、景點相關的數據庫;遊戲類APP則會匹配遊戲術語,如此來自動區分智能語音場景,從而提高語音識別準確率。

用得越多,越發覺得百度輸入法處於行業領先並非偶然,在開啓極簡語音模式後,對縮小在直播、遊戲界面上的語音條感覺貼心,在不遮擋畫面的前提下,能夠實現快速輸入,這種人性化改進讓百度語音輸入法帶有令人喜歡的黏性。

“全感官輸入2.0”的神奇體現在多方面,語音輸入只是其一,手寫輸入同樣驚豔,其識別能力無視潦草,能夠將看似一團亂麻的手寫體精準還原成打印體。百度輸入法的高效手寫識別得益於成熟的概率擇優技術,其原理是每一個字都會通過8方向特徵提取,這些特徵經過神經網絡模型篩選,最終給出概率最大的結果顯示。從實測結果來看,不論是單字識別,還是疊寫、連寫輸入的快速識別,手寫識別準確率已達滿值。

百度輸入法的AI功能再升級打破了貴精不貴多的傳統軟件設計理念,集成豐富的高分功能,以行業首發支持離線語音中英自由說,來彌補常規語音輸入法依賴網絡的缺陷;用“方言自由說”提高溝通效率,打造成熟的AI全感官輸入,帶來的多元化輸入體驗,讓長輩也能“零成本”流暢交流。

相關文章