智東西

作者 | 李水青

編輯 | 漠影

智東西12月31日三亞報道,昨日,在2020騰訊優圖年度媒體沙龍上,優圖實驗室各業務負責人對優圖今年在研發及產業落地中的成果進行了全面而詳細的總結分享。

騰訊優圖實驗室總經理吳運聲表示,優圖本次溝通會的主題是——“再出發”,意指在2020年疫情打亂各行各業節奏的背景下,優圖在以全新姿態重啓整個組織和團體。

騰訊優圖實驗室副總經理黃飛躍表示,在當下產業互聯網時代,優圖實驗室的定位是Π型實驗室。2020年,優圖實現了多項場景化AI技術的突破和研究層面的全面自動化,其中模型自動化生成能使算法調優耗時降低90%。

談到當下優圖AI產業落地面臨的難點,黃飛躍明確表示是AI需求的碎片化、場景化,並對優圖已有的思考和應對方案進行了以點帶面的解讀。

黃飛躍報告到,目前,優圖實驗室已經在全球獲得超過800項專利,有超過50餘項專業比賽、活動中的冠軍或刷新世界記錄。同時,優圖已推出20多個“AI+”解決方案,並達成100多個明星案例。

溝通會最後,智東西等少數媒體對騰訊優圖實驗室副總經理黃飛躍 、騰訊優圖實驗室總監任博及總監吳永堅進行了專門提問。

一、吳運聲:落地健康碼、騰訊會議等,同時促進科技向善

儘管在2020年新冠肺炎疫情令許多行業部署打亂,吳運聲稱,優圖AI技術依然在多個行業取得突破。

比如在疫情中,優圖主導的人臉核身爲主導的健康碼技術,在全國30多個省市、直轄市、區域得到應用,克服了許多困難。

也由於疫情,騰訊會議被許多人熟練使用,其中優圖計算機視覺等AI技術也被廣泛應用,體現在AI美顏、去除背景、視線矯正、暗光優化等許多智能化功能上。

此外,騰訊還聯合騰訊海納推出了健康申報、人車管理、體溫篩查以及智能隔離等功能,並在全國多個小區落地應用。吳運聲說,在過去一年疫情比較嚴重的時期,優圖技術依然在工業、教育、文旅等行業取得突破。

除了產業化,吳運聲提到優圖也在科技向善上做不斷的努力。比如推出手語互動、視障人士讀圖支持等應用,也是在今日,騰訊優圖就聯合內外發起騰訊Light·公益創新挑戰賽,發動更多產業人蔘與到科技公益中來。

二、多模態生物識別、人臉識別反攻擊等方面獲突破

會上,騰訊優圖實驗室副總經理黃飛躍進一步具體解讀了騰訊優圖這一年的發展。黃飛躍認爲可以用兩個關鍵詞總結——突破和自動化。

優圖在哪些方面取得了“突破”?

黃飛躍以點帶面地談到了多模態生物識別、泛人臉識別、防Deepfake人臉攻擊等具有代表性的領域。

在多模態地生物識別領域,優圖的技術目前從早期的光學人臉識別拓展到3D人臉識別,再到近紅外、掌紋、超聲波、熱紅外等技術加持,經歷了多輪迭代和深度融合。以優圖活體檢測爲例,除了用到人臉識別技術,還加入超聲波技術,以防止3D面具等破解AI的操作。

在泛人臉領域,優圖從今年開始將真實人臉識別拓寬到動漫卡通人臉識別,比如版權保護、手繪圖生成真實圖像等技術,能夠用於許多切實有需要的新行業場景。

在頗受爭議的Deepfake等人臉攻擊方面,優圖在提供安全技術體系上取得突破,構建立體化防禦層。除了針對利用照片、面具等物質介質進行防禦,優圖還在內容生成方面進行防禦,全面覆蓋人臉生成、編輯、替換等算法檢測,另外還支持數字圖像、物理世界對抗攻擊防禦。

三、自動化模型生成將算法調優耗時降低90%

如果說“突破”還好理解,那麼黃飛躍口中的“自動化”又意指什麼?

黃飛躍表示,目前優圖已能實現研究層面全面地自動化。他同樣以點帶面地談到了幾個典型方面,包括自動化數據生成、自動化模型生成等。

在自動化數據生產方面,黃飛躍用案例進行了解讀。比如自動化數據生成,騰訊優圖在疫情期間,通過數字合成3800+萬張戴口罩人臉圖像,以支持在戴口罩監測場景的視覺AI應用。

還比如在自動化標籤生成中,優圖在海量車輛無標籤數據上自動化生成標籤,效率達到1200張圖片/天,在某渣土車項目中使得整體效果提升43%。

在自動化模型設計方面,據稱優圖能夠將算法人員的調優耗時降低90%,推理耗時降低93%。如果說這一提升效果能推廣到更多的案例中,可以說能夠大大提升模型的生產效率。

五、產業落地中,如何面對AI需求的碎片化、場景化?

優圖在今年的產業落地中遇到了哪些問題?

對此黃飛躍表示,優圖洞察到,當下AI需求整體呈現碎片化、場景化特徵。

爲應對這一行業問題,團隊也制定了應對方案。針對AI需求碎片化特點,優圖的解法是構建全面體驗化能力;針對需求的場景化特徵,優圖則採取分佈定製化解決方案。

1、構建全面體驗化能力,應對需求碎片化問題

如何打造和施展全面體驗化能力?黃飛躍首先通過騰訊會議的案例對此進行了解讀。

黃飛躍表示,在騰訊會議使用過程中有許多碎片化的需求,爲此優圖進行了許多技術開發。比如聚焦用戶開會背景中有私密性元素的問題,優圖提供了基於人像分割技術的虛擬背景,使得邊緣分割精度達像素級,並保證視頻幀間的穩定處理。比如針對開會視線偏離及走神問題,優圖研發並落地了眼神矯正算法。

在疫情中,超5000家政府和相關機構採用了優圖提供人臉核身技術,離不開優圖此前在騰訊會議、微衆銀行、騰訊小程序等項目中接觸大量客戶積累的經驗。而除了人臉檢測技術,優圖的活體檢測技術也很重要,也是通過海量用戶觸達更新技術。

在刷臉支付方面,優圖的技術方案已經在100多個場景落地,爲大量場景帶去便捷支付體驗。基於端雲協同,方案能夠實現秒級刷臉、精準3D識別,並開發出滿足戴口罩識別、暗光刷臉等碎片化場景需求的方案。

在OCR識別方面,優圖也構建了4大完整的解決方案,具備50項原子能力。當前,優圖OCR能力已經從識別進化到理解,助力了金融、財稅、法律服務等多個行業,比如在本次全國人口普查中就得以應用。

2、定製化解決方案,應對場景化

面對場景化的需求,優圖如何做定製化解決方案?

黃飛躍以零售、工業、媒體業務三個行業爲例進行了解讀。

在零售方面,前幾年行業長期以來關注人、貨、場,而優圖在此基礎上,更注重以人爲核心構建數字化連接,縮短人與貨的連接路徑,讓場無處不在。以AI試裝應用爲例,優圖的技術目前支持實時視頻流,並大大提高色彩還原度及素材貼合度。

在工業方面, 面對各行各業差異化需求,今年優圖聯合騰訊雲推出工業AI平臺,目前已爲3C、半導體行業的夥伴提供定製解決方案。

在媒體業務方面,優圖推出媒體AI中臺,已經在廣電媒體行業深入落地,爲廣電傳媒行業提供智能標籤、智能編目、智能審覈、智能拆條等全流程服務,賦能媒體行業轉型。六、做Π型實驗室,不斷自進化

黃飛躍表示,∏型人才是指至少擁有兩種專業技能,並能將多門知識融匯貫通的高級複合型人才。而作爲一個研究和產業化兩手抓的實驗室,優圖的定位是Π型實驗室,是一個持續自進化的實驗室。

回顧優圖的發展歷程,在早期互聯網時代,騰訊優圖主要專注基礎研究;在互聯網+時代,優圖確立研發和落地兩條腿走路;而進入當下的產業互聯網時代,優圖則更強調合作夥伴良好互動,一起發展AI事業、聯結及AI生態。

當智東西問到,在各個階段騰訊優圖克服了或正在克服哪些難點?

黃飛躍表示,在互聯網時代,優圖1.0時期更聚焦於人臉技術的研發及視覺AI技術拓展,支持內部業務。當時的難點更多是挖掘重要的技術,讓別的部門對團隊有信心,達到深度合作。比如,2014年當時和微衆銀行合作時,就面臨能否滿足需求、符合金融標準等懷疑。

在互聯網+時代,優圖2.0一方面發力AI技術,另一方面在思考怎麼更好地給外部客戶實現實際價值。2.0初期優圖還是獨立實驗室,這時候的難點聚焦於怎麼了解外部客戶的需求,做出更多有價值的事情。

而到了產業互聯網時代,優圖3.0已經加入騰訊雲與智慧產業大事業羣(CSIG),而當下AI落地已經非常普及。面臨的新問題是AI需求非常碎片化、發散,因此需要專業解決方案的定製,比如優圖推出了工業、傳媒等AI平臺。另一方面,面對長尾化、場景化的需求,優圖也推出了自動化AI平臺。七、不爲了開源而開源,生態構建是自然而然的事

在會議最後的採訪環節,當智東西問到,優圖在今年6月開源的AI框架TNN有什麼亮點和最新反饋?優圖又如何看待開源生態?

騰訊優圖實驗室總監吳永堅表示,優圖早在2016年就開源了專注移動端的推理框架ncnn,而今年開源的TNN是對ncnn框架進行了重構升級。TNN是針對手機端的高性能、輕量級移動端推理框架,更支持跨平臺能力,另外和算法有更好的結合,大大降低了開發門檻。

在技術生態方面,吳永堅認爲生態構建是一個自然而然的過程。它談到了優圖開源AI框架的初衷:優圖對於開源,不爲開源而開源,還是希望自身先用起來,然後本着程序員的情懷,把優質的框架開放共享。

結語:頭部玩家打磨差異化,推動AI落地行業

時至年關,個人、企業都在對自身一年的得失功過進行總結回顧。對於騰訊優圖來說,2020年的疫情危機也爲AI技術產業化帶來了轉機。相比於2019年,優圖今年在展示AI技術突破的同時,顯然更關注產業落地進展。2021年,平衡好研發和產業化的關係,對優圖來說依然尤爲重要。

隨着新基建的推進和產業AI化的深入發展,具有AI基礎能力的頭部科技企業在產業中的勢能和影響力逐漸變大,相信行業不久後會迎來新的洗牌。

在當下視覺AI賽道上,各大頭部玩家進入打磨差異化的階段,誰能夠在下一步將AI落地的小旗子插到更多的山頭,我們拭目以待。

相關文章