摘要:信息維度更高加之數據量更大,因此以圖像和視頻爲主要處理對象的計算機視覺要比以文字或語音爲主要處理對象的其它AI技術具有更加豐富的應用場景和商業化價值。三維視覺智能的研究就是集合計算機圖形學、計算機視覺等領域的技術與傳統的人工智能、學習、大數據等很好地交叉融合。

有多少人曾羨慕過《鋼鐵俠》、《機器公敵》、《星球大戰》等科幻電影中出現的機器人及全息AR技術 —— 主角隨意揮手、動作,眼前的虛擬影像即出現相應的變化。近年來智能、激光、3D等投影技術發展迅速,機器人人工智能領域的突破想象,我們對未來的人和機器又能有何預判呢?

衆所周知,人工智能是模擬人類智能的技術,實現對人類智能的完全再現,是人工智能的終極目標。而人類智能是從人類的感官和認知開始的。所以,人類的感官往往成爲研究人工智能的入手點,比如視覺。

對於人類而言,不僅可以通過眼睛“看清”周圍環境中的東西,還能“識別並理解”這些東西,對這些東西形成“認知和決策”。現在,越來越多的AI領域的研究人員正努力讓AI同樣做到這一點。從人類的三維視覺出發,三維視覺智能已成爲人工智能研究和應用的熱門領域。

三維視覺智能的研究就是集合計算機圖形學、計算機視覺等領域的技術與傳統的人工智能、學習、大數據等很好地交叉融合。三維視覺技術的發展得益於視覺傳感器的快速發展,已經在推動很多應用,比較有代表性的包括無人車、機器人,以及娛樂、影視等其它領域的應用。

作爲AI時代的兩個主要的入口,計算機視覺是AI行業最具商業化價值的賽道,智能語音產業即將進入爆發期。首先,計算機視覺在AI領域中應用場景最豐富,極具商業化價值。計算機視覺主要以圖像和視頻等高維、密集數據爲主要處理對象,信息提取程度更深,應用場景更加豐富。目前,國內外均有40%以上的AI企業聚集計算機視覺領域,市場規模在所有領域中全球第二、中國第一,商業成熟度較高,2017年中國計算機視覺應用規模約爲15.5億元,預計17-22 CAGR超56%。其次,智能語音領域,根據Gartner 2018 AI技術成熟度曲線,語音識別、虛擬助理等相關智能語音技術歷經淘洗已相對成熟,未來將推動產業走向爆發期,預計整個市場規模將從18年的75億美元增長至24年的215億美元,CAGR達19%。

計算機視覺是國內外AI企業最集中的領域,商業成熟度較高。從AI企業的應用技術方向分佈來看,計算機視覺技術企業在全球AI企業中佔比約40%,在國內佔比約46%;無論國外還是國內,計算機視覺都是AI企業最集中的領域。從市場規模來看,2017年計算機視覺市場佔全球AI市場總規模的16.9%,排在語音識別之後;而國內計算機視覺市場佔AI市場的34.9%,排名第一。國內外計算機視覺的市場規模差異要遠大於企業分佈差異,說明國內計算機視覺公司的總體盈利能力較其他AI領域的公司較強,商業成熟度較高。

計算機視覺是AI領域應用場景最豐富、商業化價值最大的賽道。目前,AI技術處理的數據類型不外乎四類:文字、語音、圖像和視頻。從信息維度來看,從文字到視頻維度是遞增的,文字的信息維度最少、包含的信息量也最少,視頻的信息維度最多、包含的信息量最大。反映在數據量佔比上,以線上數據爲例,根據Cisco的研究,到2022年全球線上視頻流量佔總流量的比例將從2017年的75%上升到82%,說明線上數據將越來越被視頻數據所主導。

微美全息WIMI專注於計算機視覺全息雲服務。微美全息覆蓋從全息計算機視覺AI合成、全息視覺呈現、全息互動軟件開發、全息AR線上及線下廣告投放、全息ARSDK支付、5G全息通訊軟件開發、全息人臉識別開發、全息AI換臉開發等全息AR技術的多個環節,是一家全息雲綜合技術方案提供商。其商業應用場景主要聚集在家用娛樂、光場影院、演藝系統、商業發佈系統及廣告展示系統等五大專業領域。

微美領先的全息AR內容製作功能圍繞圖像採集、對象識別、自動圖像處理和計算機視覺技術而構建。微美的軟件工程團隊和可視化設計團隊緊密合作,不斷推進這些可視化相關技術,並利用它們設計和生產創新的全息AR內容。通過提供精確姿態估計的實時計算機視覺算法,能夠在幾秒鐘內執行場景識別和跟蹤。這種尖端算法還允許微美以像素爲基礎執行照片級真實高分辨率渲染的可視化。Frost&Sullivan表示,雖然大多數同行公司可能會識別並捕獲特定空間單位內的40到50塊圖像數據,微美可以收集的數據塊數量達到500到550;微美的圖像處理速度比行業平均水平提高了80%,從而提高了運營效率。在場景重建過程中,微美的自動圖像處理工具可以對最初拍攝的圖像進行噪聲清除和特徵增強,從而能夠創建具有業界領先模擬度的同類最佳全息AR設計。

全息3D人臉識別軟件的開發基於微美的全息成像特徵成像檢測和識別技術、模板匹配全息成像檢測技術,以及基於深度學習和訓練的視頻處理和識別技術。傳統的2D面部識別技術是一種基於面部特徵的識別技術,它從面部圖像或面部視頻流中捕獲信息,並自動檢測和跟蹤目標面部;微美的全息3D面部識別技術是全息成像捕捉和3D肖像的結合的識別技術。微美專注於軟件技術的開發和應用,並擁有AI、機器識別技術、機器學習、模型理論和視頻成像處理技術。全息3D面部識別技術是一種利用結構光和紅外光的集合技術,所收集的特徵點可以超過30,000點;傳統2D面部識別技術的收集特徵點不到1000點。並且3D技術受到周圍環境的影響較小,有望克服傳統2D面部識別技術中發現的如光線、姿勢、遮擋、動態識別和麪部表情等許多問題。

信息維度更高加之數據量更大,因此以圖像和視頻爲主要處理對象的計算機視覺要比以文字或語音爲主要處理對象的其它AI技術具有更加豐富的應用場景和商業化價值。因此,當前資本市場也正以其資源配置、資產定價功能充分反映計算機視覺相對其它AI領域的優勢。

通過三維視覺與人工智能技術的結合,可以讓機器人更加智能化與功能化,讓機器人做更多人在現實生活中能夠做的事。機器人具備現場自主決策和執行的能力,比如在工業流水線上可以幫助組裝配件,物流場景中搬箱子等。這樣的應用,涉及到非常精細化的技術,比如準確高效的運動規劃,還有各種各樣的控制,智能的執行等。因此在這方面也有了些探索性的工作。人工智能大潮下,面向C端如何用低成本的硬件來培養用戶習慣;面向B端和G端又如何提供更多附加價值或持續迭代價值,這些都是現在的AI人需要思考的問題。

根據IFR的報告,全球服務機器人市場規模預計2012-2017年年複合增長率將達到17.4%,2017年達到461.8億美元。2016年4月,工信部、發改委、財政部聯合印發《機器人產業發展規劃(2016-2020年)》,規劃要求,五年內形成我國自己較爲完善的機器人產業體系。我們依此判斷,到2020年,我國將形成完善的機器人產業體系,並逐步邁向中高端領域。未來,隨着科學技術的發展,我們有望看到更多科幻中的技術,走到現實生活中來,造福於人類。(本文來源網絡,僅供交流參考)

相關文章