「Everyone’s talking about AI. Huawei is making it happen.」

你坐飛機的時候有沒有想過一個問題:「爲什麼我坐的飛機總是不靠廊橋,還要拿着行李去擠擺渡車?」

通常,相關人員會告訴你:廊橋資源比較珍貴,因此飛機靠橋的幾率要低於停在遠機位的幾率。

其實,這個答案只說出了一部分原因。

隨着機場航班數量的不斷增加,「靠橋率」成爲了衡量機場運行管理水平 的重要指標。要在這個指標上有所提高,除了改善硬件之外,「調度」也是一個突破口。

在國內,深圳機場率先找準了這個「突破口」。

深圳機場的廊橋機位與遠機位的比例爲 1:3。按照這個比例,很大一部分乘客都需要乘坐擺渡車。那麼,如何讓更多的航班停靠在廊橋呢?深圳機場給出的解決方案是:AI 智能調度。

在 2018 年之前,深圳機場使用的調度方案主要是人工和系統配合的,每天 1000 多個航班的機位分配需要花掉 4 個小時。從 2018 年 11 月開始,深圳機場開始建設機位資源智能分配系統,2019 年正式上線。該系統將靠橋率提升了 10 個百分點,每個廊橋每天能多保障一個航班,一年之內爲 400 萬旅客省去了坐擺渡車的麻煩。同時,它還將機位分配的時間縮短爲 1 分鐘。

在剛剛結束的華爲雲 TechWave 人工智能專題日上,華爲雲人工智能領域首席科學家、IEEE Fellow 田奇向我們講述了華爲雲 EI 運用 AI 技術帶來的諸多智能化變革,深圳機場智能機位分配只是其中的一個例子。類似的例子還有很多,比如通過智能調配路上的信號燈縮短停車等待時間、利用智能防暴力卸貨方案防止工作人員對快遞進行暴力分揀等。

華爲雲人工智能領域首席科學家、IEEE Fellow 田奇

AI 是一個需要長期積累的行業,事實上華爲早就開始了 AI 相關研究,但一直比較低調,諾亞方舟等實驗室也很少出現在「臺前」。與之形成鮮明反差的是,華爲手機的 AI 技術卻屢次成爲大衆熱議的話題。近幾年,華爲雲全棧全場景 AI 強大的行業落地能力,在華爲雲 EI 企業智能體現得淋漓盡致。雖然成立還不到三年,華爲雲 EI 已經在 10 多個行業的 600 多個項目探索和落地。

而這一切,都離不開 AI 基礎研究的支撐。

作爲一個橫跨學界和業界的研究者,田奇博士的加入爲華爲雲 EI 的基礎研究制定了新的規劃。在他的帶領下,華爲雲 EI 將專注於計算機視覺、決策優化和語音語義三大方向,並於近期在這三個方向上取得了多項世界第一的成績。

計算機視覺:頂會論文近百篇,登頂 ImageNet、COCO 等權威數據集

計算機視覺是 AI 領域應用最廣泛的技術之一,很多行業痛點都可以通過計算機視覺算法來解決,如道路擁堵診斷分析等。爲了解決這些痛點,田奇博士帶領的視覺研究團隊從圖像分類、檢測、分割、多模態數據處理等多個方向入手,在基礎研究領域取得了多項突破,有近百篇論文被 ICCV、ECCV、CVPR 等頂會收錄。

圖像分類:登頂 ImageNet、WebVision 數據集

作爲人類最基本的能力,大腦可以對眼睛看到的常見目標進行精準的識別,比如貓、狗、車等。但是,由於每個人知識的侷限性,常人很難完成成千上萬類的物體識別。

爲了解決這個問題,華爲視覺團隊從 2019 年年底開始發力,自研出了基於知識蒸餾與數據增強的分類算法,大幅提升了圖像分類的性能。今年 3 月份,在 ImageNet-1000 大規模圖像分類數據集上,該團隊的 EffNet+CAKD 算法 top-1 精度達到了 85.8%,超越了長期以來霸榜的谷歌。

其實,圖像分類並沒有看起來那麼簡單,標註數據中會存在很多噪聲。在這些噪聲的「誤導」下,模型很容易出錯。

爲了讓 AI 像人類一樣更魯棒地去處理有噪聲數據的任務,華爲視覺團隊提出了新的 AI 模型學習範式,旨在提升 AI 模型對數據中錯誤樣本的容忍度。

在由蘇黎世聯邦理工、Google Research、卡內基梅隆大學等共同組織的人工智能「世界盃」——WebVision 大規模網絡圖像數據識別競賽中,華爲以 82.97% 的精度擊敗了來自世界各地的 94 支參賽隊伍,達到業界第一。

在無監督學習方面,華爲視覺團隊自研的無監督學習算法在無標籤的 ImageNet 數據集上達到了 72.4% 的精度,比 Facebook 何愷明組的 MOCO v2(71.1%)還要高出 1.3 個百分點。

圖像檢測與分割:登頂 COCO 數據集

不同於圖像分類技術,圖像檢測和分割旨在讓計算機可以像人一樣識別到圖片中更高層次的語義信息,比如檢測目標的位置、理解目標的相互關係等。

爲了解決這一類問題,華爲視覺團隊自研了自適應數據增強技術,在包含 16 萬張圖像的 COCO 數據集上實現了單模型 56.8%、多模型 58.8% 的檢測精度,兩項指標均達到了世界第一,打破了谷歌等公司在該領域多年的壟斷。

在這次疫情的大考中,原來只能依靠人類專家完成的新冠肺炎檢測任務,華爲雲依靠領先的圖像分割技術實現了肺炎更精準、更快速的檢測,可以達到 CT 量化結果秒級輸出,大大提升了輔助診療的質量和效率。

多模態數據處理:登頂 NuScenes 數據集

前面提到的圖像分類、檢測、分割等都是相對獨立的任務,但在現實生活中,人們處理的往往是多個維度、多個模態的數據(如聊天時同時面對人臉和聲音),計算機也不例外。

爲了挖掘和整合不同模態數據之間的知識,華爲視覺團隊提出了圖像底層信息融合技術,來處理語義分割信息和激光點雲等多模態數據。在全世界最大規模的 3D 目標檢測數據集 NuScenes 上,該團隊擊敗了來自世界各地的 92 支隊伍,達到了 64.2% 的檢測精度,取得業界第一,領先第二名 3.1%。

在該項多模態技術的推動下,華爲雲 EI 提出了交通智能體,來解決「你今天堵車了嗎」這個靈魂質問。

這些成果的取得和田奇博士的加入不無關係。田奇博士畢業於伊利諾伊大學香檳分校,師從計算視覺之父 Thomas S.Huang 教授。在加入華爲之前,他在德州大學聖安東尼奧分校任教 17 年。目前,他已累計發表文章超過 550 篇,其中 250 多篇入圍 IEEE TPAMI、IJCV、CVPR/ICCV/ECCV、NeurIPS 等國際頂級期刊和會議。

在 2018 年加入華爲之後,田奇博士迅速適應了學界和業界的巨大差異,認識到「工業界更注重於商業價值以及方法的實用性,針對某一個特定的問題,提升用戶體驗,帶來實際的價值」。在這種信念的指引下,他帶領華爲的視覺團隊取得了多項基礎研究突破,並將其落地到華爲雲 EI 的多個項目中。

針對視覺領域存在的諸多問題,田奇博士在今年 3 月份的華爲開發者大會 2020(Cloud)上發佈了《華爲視覺研究計劃》,旨在爲小樣本訓練、多模態學習、端側模型瘦身等提供解決方案。

決策優化:在 ESICUP 上達到世界最優

將一塊大玻璃切成不同的形狀,怎麼切才能最大程度上減少浪費?將裝有貨物的箱子裝進集裝箱,如何實現空間利用的最大化?這些都是現實生活中普遍存在的決策優化問題,也是華爲雲 EI 重點發力的一大方向。

爲了在工業生產過程中儘可能減少材料浪費、降低生產成本,華爲雲 EI 提出了業界頂尖的決策優化方案,在業內公開數據集 ESICUP 上達到世界最優,用最少的投入獲得了最大程度的收益。

除了文章開頭提到的飛機靠橋率,這類問題在其他行業也非常常見。以物流行業爲例,在路線優化問題上,華爲雲的智能系統改變了人工查詢距離、匹配車型等操作,改爲系統自動測算。相比於模擬人工編排路徑得到的初始解,優化後的結果的整體運費下降了 20-30%。

語音語義:DiggScience 全球第一

華爲雲 EI 語音語義團隊着力於發展私人定製化的語義服務,不斷訓練機器並自動學習,賦予機器認知、意識和推理的能力。同時,團隊還開發出了世界頂尖的知識圖譜平臺,完成了從感知智能到認知智能的躍變。

這些成果也得到了海內外機構的高度認可。在 2019 年 10 月的 DiggScience 科學數據挖掘大賽(學術論文搜索匹配大賽)上,華爲雲以 58.7% 的準確率奪冠,超過第二名 5 個百分點。在今年 2 月的第 13 屆網絡搜索與數據挖掘國際會議(WSDM 2020)上,華爲雲帶領的聯合團隊摘得 WSDM Cup 2020 大賽「論文引用意圖識別任務」金牌。

落地的背後

從以上研究成果和應用案例我們可以看出,華爲雲在 AI 基礎研究的落地上是非常成功的。但有一點不可忽視:前沿研究和業務落地之間總是存在巨大的差異,田奇博士稱之爲「AI 使能鴻溝」。

從華爲雲 EI 落地的領域中我們不難發現,華爲的團隊挑的都是一些「硬骨頭」。以工業視覺場景爲例,在學術界,研究者面臨的往往是標註準確、畫質清晰的圖像,但在工業界,標註錯誤、圖像模糊是非常常見的,而且數據量也要大幾個量級。同樣嚴重的問題還有醫療領域的小樣本訓練以及端側的模型瘦身等,而這些都是華爲雲 EI 發力的領域。

橫跨學界和業界的雙重身份使得田奇博士能夠更加敏銳地感受到這些差異。在加入華爲之後,他帶領團隊不斷克服這些挑戰,探索出了一系列解決方案。

除了技術層面的攻關之外,田奇博士在接受機器之心採訪時還提到了華爲雲的團隊合作機制及人才的選拔標準。

在團隊合作方面,他表示,華爲有着一套完整的促進研究組和產品線合作的機制,二者可以通過公司內部各種各樣的活動進行交流,比如羅馬廣場、松鼠會等。研究組分享前沿的科研成果,產品線提出自身的業務痛點問題,一旦發現合作的機會,兩者就可以通過聯合項目組的形式進行攻關。同時,公司還創建了訪問學者等機制,以期更好地促進研究組和產品線的溝通。

在人才方面,他指出,華爲雲 EI 團隊需要的是既懂算法,又懂平臺,而且還能瞭解行業的人。爲什麼這麼講?首先從研究方向來看,越來越多的行業要求爲 AI 模型融入知識,將從業人員的經驗系統化爲行業知識圖譜,使模型具備推理的能力,從感知智能過渡到認知智能。從行業需求來講,不懂行業的研究者很容易陷入僞需求的漩渦,做出的產品與真實場景不匹配,無法解決行業痛點。

田奇博士還指出,在人才方面,除了鼓勵算法研究者去向行業人員學習背景知識外,還要說服行業專家去分享自己的行業知識,使其接受 AI,這就要在溝通上多下功夫。

在談到華爲雲 EI 的下一個技術發力點時,田奇表示,華爲雲 EI 將聚焦於兩個方向:華爲雲體系架構和核心算法在行業中的落地。在體系架構方面,華爲雲希望將來端、邊、雲能夠更好地協同, 引入更多樣化的端,同時結合華爲在 5G 和 IoT 的連接優勢,賦能更多的行業。在算法方面,華爲希望能跟行業相結合,解決行業中的實際問題,使得核心算法落地行業。

面向分佈式 AI 開發及計算場景,華爲雲推出 ModelArts Edge 智能小站

在研究和產業部門的密切配合下,華爲雲 EI 克服了落地的重重挑戰,不僅將上述業界頂級的 AI 技術用到了自己產品中,還將其帶到了各個行業。

而這一切,都是通過一個叫 ModelArts 的一站式 AI 開發管理平臺實現的。該平臺爲機器學習與深度學習提供海量數據預處理及半自動化標註、大規模分佈式 Training、自動化模型生成,及端 - 邊 - 雲模型按需部署能力,幫助用戶快速創建和部署模型,管理全週期 AI 工作流。

如今,這一平臺又有了新的延伸——ModelArts Edge 智能小站。

ModelArts Edge 智能小站主要面向分佈式 AI 開發以及計算場景的需求,解決用戶在自建 AI 平臺過程中存在的一些痛點,如平臺部署難度高;建設週期長,無法跟上快速變化的業務趨勢等。

ModelArts Edge 沉澱了華爲雲 EI 在計算機視覺、決策優化、語音語義等領域的核心技術,以一體化全棧方式交付完整的 ModelArts 平臺服務能力,是公有云服務在邊緣側的延伸,也是業界首個 AI 訓練及推理邊緣小站方案。

華爲雲人工智能領域首席科學家田奇在華爲雲 TechWave 人工智能專題日發佈 ModelArts Edge 智能小站。

爲了讓智能小站爲客戶提供與華爲雲上 ModelArts 一致的服務,該小站與 ModelArts 平臺保持了 3 個統一:統一硬件平臺、統一軟件架構、統一平臺服務。

在數據安全方面,智能小站部署在客戶數據中心,通過物理隔離以確保安全合規,實現了數據本地存儲、本地訓練、本地推理。

在運維方面,小站通過專線接入華爲雲運維中心,實現統一運維。用戶可以通過雲上完成訓練作業下發,而數據存儲、訓練、推理均在客戶機房完成。

華爲雲的技術專家在採訪中介紹了小站的一些具體應用案例。以某大型電網公司爲例,該公司在各個省都有節點,但各省數據量不夠大,因此需要在中心訓練後再推到省節點進行迭代。這種情況下,更好的方案是在總的節點上建一箇中心的「雲」,每個省節點部署 ModelArts Edge 智能小站。各個省之間可以通過聯邦共享數據。醫院的場景也是如此。

田奇表示,未來,華爲雲 EI 還將持續把華爲 AI 前沿算法產品化,並開放給各行業的 AI 開發者使用,通過技術創新驅動產業智能升級。

若有對華爲雲 EI 產品解決方案的需求,可點擊以下鏈接,提交需求。

https://jinshuju.net/f/GoLKnY

相關文章