新浪科技 鄭峻發自美國硅谷

新冠疫情肆虐全球,讓在家辦公成爲了常態,也讓視頻會議成爲了日常需求。Zoom成爲了全球視頻會議市場的最大贏家。

Zoom去年年底日用戶峯值還只有1000萬人,今年4月底已經達到了3億人,一個季度增長了三十倍。今年以來,Zoom股價從68美元一路飆高到目前的220美元價位,市值超過了620億美元。市場調查機構Datanyze的數據顯示,Zoom在美國視頻會議的市場份額高達36.3%,隨後則是視頻會議應用GoToWebinar和思科Webex。

相比之下,谷歌微軟蘋果等傳統巨頭此前幾乎沒有發力這一領域。他們要麼沒有重視開發這一需求產品,要麼相關產品不夠簡潔專注。巨頭的缺失也讓視頻會議市場帶來了競爭空間,成爲了新貴們爭奪的領地。

但谷歌和微軟兩大巨頭已經盯上了這塊變大的蛋糕,近期先後在Google Meet和Microsoft Teams產品上推出了系列新功能,希望吸引自己原本巨大的用戶基礎。Zoom產品的功能缺失就成爲了兩大巨頭的發力重點,背景降噪就是其中之一。在這一方面,兩大巨頭雄厚的人工智能實力將提供堅實的技術支持。

Google Meet's noise cancellation feature in action

微軟5月份就表示,近期會在Teams推出無關背景聲的降噪功能。不過,Google Meet還是比微軟更早一步,他們本週就推出了強力背景降噪Cloud De-Noiser。目前已經在G Suite的網頁端推出,隨後會在iOS和Android升級。AI模式可以識別所有語言的聲音。谷歌表示,Meet今年4月底的日會議參與用戶已經達到了1億人。

打開這一功能之後,除了你的說話聲,其他背景聲音通通消失。視頻會議就只有會議應該有的聲音,再也不用擔心令人尷尬的聲音干擾你的視頻會議了。用戶在視頻會議時再也不用擔心自家狗狗的叫聲打擾會議,也不用對持續不斷的鍵盤打字聲感到煩躁,不用擔心喫飯的吧唧聲。當然,也不會再聽見馬桶沖水的聲音。但De-Noiser功能也會智能保留一些可能有益於會議的自然背景聲音,例如說話者的深呼吸聲和笑聲。這項功能已經在內部測試和優化了一年多時間,今年1月開始在谷歌全公司內側。

Cloud De-Noiser的功能背後是谷歌基於雲端的機器學習算法。算法會智能過濾掉各種背景干擾聲。谷歌G Suite產品管理總監拉查佩爾(Serve Lachapelle)在演示視頻中,先後讓薯片塑料袋、圓珠筆等各種雜亂的背景聲音消失。雖然在強力降噪模式下,他原本的說話聲音變得有些沉悶,但依然清晰可辨,完全不影響視頻會議的工作效率。

拉查佩爾表示,自己在谷歌瑞典辦公室工作,和谷歌硅谷總部存在着時差,經常在喫飯時間和總部同事開視頻會議。去除各種喫飯時候的尷尬聲音,是他們一年半之前開始研發De-Noiser功能的主要動力。G Suite團隊就各種背景聲音打造了AI模型,解決了遲滯問題。他們用自己上千次的視頻會議數據,對模型進行不斷訓練,更好地辨別人聲和背景聲。

拉查佩爾從事視頻會議相關產品功能已經有25年時間,效力谷歌也已經有13年時間。2017年穀歌收購一家創業公司Limes Audio,招納了一批音頻工程師。此外,谷歌人工智能部門Google Brain和Google Reserch也提供了技術幫助。谷歌在聲音識別和增強領域已經進行了數年研發,有了大量的技術積累。

相關文章