對於我們這代人來說,輸入法註定是被定格的記憶。

習慣了將老式諾基亞藏在課桌抽屜裏盲發信息的暢快,即使到了全觸屏的智能手機時代,照舊對九宮格念念不忘。以至於當習慣全鍵盤輸入的00後們走上互聯網舞臺後,在江湖上掀起了一場輸入法的流派之爭。

作爲移動互聯網時代的史詩級產品,輸入法見證了商業更迭的市場規律,承載了用戶行爲的變遷軌跡,自身也在技術浪潮的推動下完成了一次次的躍遷:搜狗將輸入法從單機時代帶進了互聯網時代,訊飛又爲輸入法打開了人工智能的大門。

藉着訊飛輸入法上線10週年的契機,似乎有必要盤點下輸入法在上一個10年的歷程:站在人工智能時代的起點上,曾經革新了移動互聯網交互方式的輸入法,還將對世界產生什麼樣的影響?01 “宣戰”自帶輸入法

2010年是必須被載入智能手機史冊的一年。

喬布斯老爺子在這一年推出了配得上“改變世界”稱號的iPhone 4,沉寂許久的手機行業開始暗流湧動。無數創業者陸續開始了智能手機的征程,原本獨立於硬件之外的野蠻人也紛紛加入戰場。

時間證明了這羣聰明人賭對了風口,2010年被視爲智能手機普及的元年,塞班戰線徹底被擊垮,一大批踩準了時間節點的安卓廠商成了最終的贏家。

其實在智能手機的正面戰場之外,還存在一條隱蔽的戰線:智能手機的出現改變了原有的產品形態,傳統的物理鍵盤徹底消失,虛擬輸入法逐漸成爲一種剛需,如何提升用戶的輸入效率,成了多方力量角逐的賽點。

在PC時代殺出一條血路的搜狗輸入法,隨即開始向手機市場傾斜,原本適用於PC的產品邏輯被複制到手機上;汲取了PC市場經驗的手機廠商也開始行動,谷歌將自家的輸入法作爲系統的默認選項,主張封閉生態的蘋果牢牢掌控着輸入法的控制權,直到2014年纔開放了第三方輸入法的 API。

同樣是2010年,科大訊飛的一羣工程師們也加入了手機輸入法的角逐賽,不過他們並沒有沿襲功能機時代的輸入理念,而是主打語音技術,在既有輸入鍵盤上增加一個麥克風圖標,用戶點擊後就能語音輸入。

訊飛輸入法的工程師們算了這樣一筆賬:普通人一分鐘打字的速度在60個左右,但一分鐘可以說180個以上,倘若可以用語音輸入替代手動打字,輸入效率將提升300%。何況彼時智能手機的屏幕尺寸還只有3.5寸上下,手指需要在狹小的屏幕上“做文章”,用戶體驗可想而知。

於是一羣從用戶體驗視角出發的工程師們,向手機廠商和輸入法市場的老玩家們發起了挑戰,試圖重塑輸入法的產品形態。

時間同樣驗證了訊飛輸入法的前瞻性,到了2012年的時候,搜狗輸入法和百度輸入法先後推出了語音輸入,2013年訊飛輸入法的激活用戶量正式破億……語音輸入逐漸衍生成爲新的流派。

按照賽諾發佈的《2019中國手機輸入法年終報告》顯示,訊飛、百度、搜狗佔據了96.1%的市場份額,第三方輸入法將客場變成了主場。02 爲工具產品正名

第三方輸入法的崛起似乎並不讓人意外。

智能手機時代的降臨,催生的不只有造機潮,還有工具產品的爆發:早期的原生操作系統體驗並不完善,桌面類、美顏類等工具類產品悄然崛起,第三方輸入法或多或少享受了特殊的紅利週期。

正如獵豹經歷了谷歌大面積下架的風波後,傅盛在接受媒體採訪時說的這樣一段話:“我知道工具會退潮,從2015年就知道。但我們從來沒有想到,變化會是斷崖式的。”工具類產品在2015年達到鼎盛,久邦、獵豹等企業先後上市。但在2016年就開始出現轉折,隨着原生操作系統的完善、人口紅利的衰減,大多數工具類產品未能及時轉型,在渾渾噩噩中走向了慢性死亡。

爲何訊飛輸入法等玩家可以逃脫工具類產品的宿命?或許可以從2016年錘子手機M1的發佈會上找到答案。

老羅在發佈會現場用很快的語速說了相當長的一段話,訊飛輸入法無時差同步輸出了文字版本,結果幾乎沒有任何偏差,發佈會現場隨即一片歡呼。發佈會結束的第二天,訊飛輸入法霸佔了多家應用商店的下載榜單。

訊飛輸入法的高光時刻至今仍時常被提及,外界忽略的是背後的技術深耕。

訊飛輸入法剛剛上線的2010年,行業內還沒有中文語音識別的概念。訊飛輸入法團隊首創了語音輸入的功能,一開始的識別準確率還只有70%作用,團隊使用大數據訓練和深度學習技術後,語音識別的準確率在2013年達到了92%,然後在2014年快速跨越到業內領先的95%,在一定程度上超出了人耳。

其實訊飛輸入法的語音識別準確率達到97%後,用戶規模已經在不到兩年時間內已經翻了一番,羅永浩的示範不過是點燃引線的小火星。

相比於那些與用戶需求和行業生態脫節的工具類產品,訊飛輸入法爲工具類產品正名的策略並不複雜,即通過技術的持續創新將工具類產品服務化,向用戶提供的不是工具,而是一種服務。

除了語音技術上的深耕,可以驗證的還有細節上的功力。比如在訊飛輸入法上,用戶想要從鍵盤切換打破手寫,無須點開特定的按鈕,可以直接在屏幕上寫字……工具的弱點是用戶粘性低、可替代性強,但訊飛輸入法用技術創新和產品服務巧妙地讓短板變成了長板。03 進擊的“全能選手”

技術上的創新徹底改變了輸入法的進化路徑。

從商業邏輯上看,輸入法避免了大多數工具類產品的覆轍,在工具產品退潮的時候,照舊坐擁了數億用戶規模;從產品策略上看,輸入法給出了超出預期的體驗,並且圍繞用戶需求進化成了“全能選手”。

工具類產品之所以被詬病,本質上還是產品價值的矮化,一旦在體驗上輸給了原生系統,用戶需求也就無從談及,用戶的離開可以說是註定的結果。訊飛輸入法的特殊之處在於,一開始就選中了語音輸入的賽道,最終憑藉在橫向和縱向的技術與業務佈局,一次次拓寬了輸入法的想象空間。

紅杉資本的傳奇締造者邁克爾·莫里茨曾言:“一個公司的基因早在它最初的18個月就被決定了,此後公司不可能再有什麼大的改變,如果DNA是對的,他就是一塊金子,如果不對,那基本就完了。”這樣的觀點一直存在不小的爭議,卻是解鎖訊飛輸入法產品進化方向的一把鑰匙。

因爲對語音輸入的執着,訊飛輸入法團隊在2011年遇到了一個難題,中國有太多人說的是方言,如果無法準確進行方言的識別,語音輸入終將淪爲雞肋。

一番用戶調查和數據分析後,訊飛輸入法選擇需求排名最高的粵語、四川話和河南話入手,2012年的一次版本更新後上線了粵語語音輸入,成爲首款支持粵語語音輸入的輸入法,緊接着上線了四川話和河南話的語音輸入。截止到目前,訊飛輸入法的粵語語音識別準確率已經超過95%,陸續上線了23種方言的語音識別。

因爲對用戶輸入習慣的洞察,訊飛輸入法在2013年上線了英文語音輸入;2015年訊飛輸入法在語音輸入的基礎上首創了語音翻譯功能 “隨聲譯”,目前已經支持英日韓俄等多種外語的面對面翻譯,輸入法開始進化成爲一種人際溝通工具。

除了語音識別技術上的縱向深挖,訊飛輸入法還積極在輸入場景上進行橫向延伸,比如在傳統的手寫、鍵盤輸入外,加入了OCR掃描、智能預測等功能。輸入法角色的多元演變是顯而易見的,早已不再是打字的工具,而是用戶連接互聯網世界的貼心助手,無限拔高了輸入法產品的價值上限。04 訊飛的語音戰事

輸入法的產品生命週期其實才剛剛開始。

訊飛輸入法上線的2010年,深度學習技術還方興未艾,人工智能還處於第二次浪潮後的靜默期。然而過了十個年頭後,等待語音技術的卻是全新的局面:阿爾法狗燃起了人工智能的第三波浪潮,深度學習等前沿技術加速了落地應用的進程,語音也從小衆一躍成爲主流的人機交互方式之一。

至少透過訊飛輸入法等行業領跑者的動作,外界看到的並非是時間賦予的老邁,而是一無既往的探索和創新精神。

就在訊飛輸入法10週年的發佈會上,知名相聲演員方清平上演了一場極限語速挑戰賽,用遠超羅永浩當年的語速讀了一段《木蘭辭》,以測試訊飛輸入法在極限快語速下的識別效果。結果讓人驚喜,方清平的語速快過了吉尼斯世界紀錄,訊飛輸入法照舊給出了100%的識別準確率。

與四年前的有所不同的是,同樣是技術上的秀肌肉,對於“快”的詮釋有了新的註解。如果說訊飛輸入法當年的一夜爆紅,某種程度上與大衆對語音輸入帶來的新鮮感有關,這一次除了速度,還有溫度。

比如訊飛輸入法新近推出的10.0版本,通過脣形輔助輸入,進一步優化輸入效率,在近距離多人說話的複雜場景中,其他人的聲音不會干擾語音識別結果;再比如針對盲人羣體輸入不便的情況,不斷無障礙模式,實現了輸入面板、菜單面板以及表情面板的屏幕隨選朗讀,用戶在視力不便的情況下也能無障礙輸入文字和表情。

至於其中的原因,似乎並不難理解。第三方輸入法上一個10年的主場是智能手機,語音輸入並非是不可替代的方案,語音輸入的早期用戶多半以極客爲主。可隨着5G與AIoT浪潮的來臨,智能家居、車載、可穿戴設備等新的場景和需求不斷增加,傳統的輸入方式越來越不友好,語音將是最核心最主流的輸入方式。

備戰了10年的訊飛輸入法,正在進入一個全新的戰場,並在積極調整姿態,除了外界所熟悉的技術牌,訊飛輸入法打出的還有同樣聚焦用戶體驗的溫情牌。畢竟當語音作爲人機交互的渠道時,不應該是冰冷的一面,這場語音戰事的結果已經可以預見。05 尾記

10歲的訊飛輸入法,就像是互聯網世界裏的時間行者。

原以爲會是失去生機的前浪,卻是人工智能語境里名符其實的後浪。如果非要給訊飛輸入法的成長軌跡做有個註釋的話,本質上在於技術派的工程師們對於語音輸入的執着,用持續創新等來了屬於語音技術的春天。

如今語音技術正當其時,訊飛輸入法的日語音交互次數已經達到10億次,累計服務設備數超5億,語音用戶佔比超70%。在人工智能時代的呼喚下,這位創新老炮兒正在以矯健的腳步邁向下一個10年。

相關文章