摘要:從整個人類社會看,AI視覺擴展了生活空間的維度,也讓更多的人享受到便捷、舒適和快樂,是目前最具想象力空間的技術之一,在這個領域,誕生出一家乃至幾家偉大的公司並不稀奇,280億估值能否進一步激發這些已經領先一步的創新企業,用成熟的產品把夢想照進現實。衆所周知,AI始終是創業的熱門領域,但最後一環的商業化也一直是個難題,直到AI識別和手機產業相結合後,原有的天花板一下子被打開了,除了傳統的安防、金融場景,AI視覺又多出一個可變現的應用。

  原標題:AI視覺識別:夢想被280億估值照進現實

來源:宜信財富

文 夏羋卬

9月初,朋友圈被Zao以迅雷不及掩耳盜鈴之勢佔領。

一條條頂着自己頭像和明星尬戲的視頻,其背後的驅動技術是一項AI視覺技術:DeepFake。

Zao並非第一款因爲AI視覺而火爆的APP,在Zao之前,FaceApp就已經爆紅過,它能根據頭像生成跨時間、跨性別的照片,且效果清晰,幾可亂真。

與此同時,8月26日晚間,AI視覺企業曠視科技(D輪估值280億)正式向港交所提交IPO招股說明書,開啓了AI視覺獨角獸衝向資本市場的新篇章。

安防,競爭並非來自內部

人類對虛擬現實的想象由來已久。

1973年,哲學家希拉里·普特南提出“缸中之腦”實驗:假設一個狂人科學家將大腦從人體取出,放入一個裝有營養液的缸裏維持着生理活性,超級計算機通過神經末梢向大腦傳遞和原來一樣的神經電信號,並對大腦發出的信號給予和平時一樣的反饋,此大腦能否意識到自己活在虛幻之中?

如果說這個問題還離我們比較遠的話,以人臉識別、虛擬成像爲代表的AI視覺技術卻已經很成熟。

2015年以來,國家持續出臺利好政策,推動了AI視覺技術在金融、安防、醫療、智慧城市、公共安全、軌道交通、政府治理及交通等行業的應用,資本扎堆佈局。這其中,依圖科技、商湯科技、曠視科技、雲從科技四家是代表性的企業,又被稱爲“AI視覺四小龍”。

目前AI視覺公認成熟的商業場景有三個:安防、金融和手機,這其中安防是傳統的主戰場,涉及萬億級別產業蛋糕,且靠近政府、銀行等企業客戶。

說得安防者得天下並不過分。

2014年,當時一家叫格靈深瞳的公司被投資人徐小平讚賞,原因是其研發出能夠識別危險手勢的智能設備,安裝在ATM機旁,一旦發現危險就可以自動報警。新技術加上傳統巨量市場,再伴隨政府機構和銀行客戶安全的硬需求,看起來是一份可以快速商業化的巨大收入。

不過,這個產品最終沒能規模化,因爲格靈深瞳的產品是做智能攝像機,帶3D景深,類似於AR、VR技術,但技術成熟度不夠,並沒到適合商用的階段。一批AI視覺企業捕捉到了這個商機,用人臉識別實現相同的功能,而圖像識別技術的成熟度是足夠的。

即便如此,以算法見長的AI視覺公司要切入安防依然舉步維艱,智能安防攝像頭要依託於整套安防體系內才能發揮作用,但行業內已經有傳統安防設備巨頭,控制着大多數市場和供應商。

早先,這些安防傳統巨頭選擇和AI視覺企業合作,按照所賣攝像機臺數支付技術授權費。但後來,這些巨頭決定轉變模式,自己搞算法,獨立開發圖像識別技術。

他們迅速成立了自己的人工智能研發團隊,爲彌補智能算法上的人才短板,充實自身實力,同時給競爭對手釜底抽薪,甚至找獵頭專門挖AI視覺企業的核心人員。

面對安防這個絕大的蛋糕,四小龍們已經不能再單單滿足做背後的技術提供者了,如果想在這個領域長期紮根下去,無論正面硬剛傳統安防企業的競爭,還是謀求建立更加穩固的合作關係,是短期內必須要做出的選擇。

手機,等待打破固有格局者

衆所周知,AI始終是創業的熱門領域,但最後一環的商業化也一直是個難題,直到AI識別和手機產業相結合後,原有的天花板一下子被打開了,除了傳統的安防、金融場景,AI視覺又多出一個可變現的應用。

目前世界上60%的攝像頭被用在手機上,像蘋果公司在AI識別上的專利收購和研發成本,已經達到近10億美元,有分析稱這個市場的收益未來不會少於金融領域。

曠視科技之前在做金融業務時,在FaceID和雲上Face ID等實際應用場景上積累了很多經驗和知識,於是很順利地遷移到了手機上的人臉識別上。

二者之間又有細節上的不同,金融領域的刷臉應用,需要按銀行要求擺動頭、眨眼睛,但在手機端,用戶不需要做這麼多動作,絕大多數是正面識別;同時,手機對用戶的體驗要求非常高,如蘋果手機人臉識別的誤失率要求爲百萬分之一,這是AI視覺供應商必須達到的。再比如在金融應用上,人臉算法做到三、四百毫秒的延遲就很不錯了,但手機的要求是延遲時間在100毫秒以內。

實際上,目前國產手機的人臉解鎖功能,與最先進感知技術依然有差距,是一種折衷方案。當前國產手機主要還是用可見光和紅外光感知人臉面部特徵,可以理解爲2D技術,這種方案不能達到區分活動的人臉與打印出來的照片的區別,因此不能應用於安全需求高的支付領域。

因此,競爭焦點在於誰能實現用戶體驗最優的3D結構光或者TOF測距技術。3D結構光,可以感知到人臉面部相互之間的距離,不再僅僅是二維平面圖,這是目前四小龍們每天着力突破的難點。

目前的競爭格局,是不同廠商獲得不同區域、品牌的人臉解鎖業務,手機廠商也希望通過這種技術提供商的分攤,避免過度集中的風險,提高談判籌碼。未來隨着某家企業掌握了3D結構光等升級技術,並獲得技術積澱後的優勢,不排除打破現有的格局,獨佔整個智能手機人臉識別市場。

求變,技術唯一,商用無限

在安防、手機領域之外,四小龍們也沒有放鬆拓展其他領域商業化落地的機會。

在人臉識別上,由宜信財富私募股權母基金投資的依圖科技多次在世界頂級人臉識別比賽中獲得第一名,其人像識別比對系統可在0.5秒級內完成單張人像查詢,並檢索億級數據庫後返回精準結果,超越了人眼識別平均水平,在青奧會、珠海航展、G20峯會等活動上實際應用。

此外,其車輛識別系統能通過對車輛品牌、型號等精準識別,實現品牌識別、假套牌庫分析、基於視覺特徵的“以圖搜車”,已經在多個省公安廳應用,並獲公安部科學技術進步獎。

甚至在2018年12月,依圖科技發佈了一個“聽寫大賽”微信小程序,內嵌各語音識別引擎,由網友自行對比識別率。最終在所有場景下的語音識別,依圖科技都遙遙領先。

值得一提的是,依圖科技進軍語音識別領域纔剛剛一年的時間。

2019年5月9日,依圖科技在上海召開發佈會,宣佈推出其首款視覺推理AI芯片產品QuestCore(求索),以及基於該芯片構建的軟硬件一體化系列產品和行業解決方案。

依圖的產品距離民生是非常近的,現在去出入境管理中心辦手續的時候,會發現使用的人臉識別設備和指紋採集設備就是依圖科技的產品。

再比如:商湯科技。這是中國第一個可考朝代——商朝的開國帝王,也體現了商湯科技的霸氣和野心。

2017年8月底,商湯的技術應用在了蘇寧在南京出的全國首家真實投入運營的無人店——蘇寧體育 Biu。其產品幫助蘇寧探索自助化售貨,智能追蹤用戶在不同貨品前的停留時間等。

曠視也在做這類探索,只不過地點選在北京聯想橋附近的物美超市,據曠視供應商透露,這類產品配件出貨量一年在一兩千套,還處於萌牙狀態。

曠視也在別的領域攻城拔寨。9月2日下午,曠視的一張路演照片在微博上流出,圖片上展示着曠視的人臉識別技術可用於追蹤學生的課堂行爲,辨別學生的“聽講”、“走神”、“睡覺”等行爲。

雲從的策略則和依圖、商湯、曠視不同,依據中科院背景,雲從希望成爲國家四個人工智能平臺之一。通過國家層面,做成人工智能基礎資源公共服務平臺後,有些事情做起來就會方便很多,比如與公安部、銀行成立聯合AI實驗室。

這種架構益處頗多,既能拿到機構穩定訂單,也可以規避數據安全性質疑。在沒找到獨特優勢前,雲從想先獨闢蹊徑,保障自己立於不敗之地。

AI大浪拍向岸邊以前,各村都在想着各村的高招。

ZAO的瘋狂用戶裂變,曠世排隊IPO,讓本已平靜的四小龍格局再次起了波瀾。

從整個人類社會看,AI視覺擴展了生活空間的維度,也讓更多的人享受到便捷、舒適和快樂,是目前最具想象力空間的技術之一,在這個領域,誕生出一家乃至幾家偉大的公司並不稀奇,280億估值能否進一步激發這些已經領先一步的創新企業,用成熟的產品把夢想照進現實?最終的AI商業帝國究竟由誰締造?

一切只有AI能夠預知。

相關文章