AI科技評論報道

編輯 | 陳大鑫

導讀:

「深度賦智」斬獲了NeurIPS-AutoDL 2019系列競賽總決賽世界冠軍,在圖像/音頻/視頻/文本/表格不同場景的十個數據集上穩定獲得八項第一和均分第一。

爲共同推動AutoDL技術的快速發展,冠軍方案的技術細節於近日首次公開,最新相關論文已被人工智能頂刊IEEE TPAMI接收。

TPAMI篩選極其嚴格,每年錄用量僅200篇左右(當前影響因子17.861,在中國計算機學會認定的人工智能領域四個A類期刊中排名第一)。

致力於用AI製作AI,「深度賦智」在AutoDL領域不斷探索前沿科技方向,取得了全新的研究進展。

近日,深度賦智聯合廈門大學紀榮嶸教授團隊首次公開AutoDL2019挑戰賽冠軍方案的研究細節,詳細介紹了AutoDL競賽中各模塊組件(元學習器、數據注入器、模型選擇、評估方法等)的設計與實現,以及競賽中benchmark相關工作和AutoDL服務,並將競賽中的完整代碼進行開源。

項目地址:https://github.com/DeepWisdom/AutoDL

目前,研究成果《Winning Solutions and Post-challenge Analyses of the ChaLearn AutoDL Challenge 2019》已被人工智能頂級期刊TPAMI錄用。

論文共同作者包括弗雷堡大學Frank Hutter、第四範式、聯想集團、Paris-Saclay大學等學者及機構。AutoDL 2019-2020系列競賽由國際人工智能頂級會議NeurIPS(神經信息處理系統大會)主辦,是人工智能領域機器學習和計算神經科學的國際頂級賽事,歷來備受矚目。

近年來,深度學習技術在諸多領域獲得了關鍵性突破。但是,多數深度學習模型的性能在很大程度上依賴於過量的模型設計策略。如果人類工程師想要讓神經網絡在特定的任務上取得理想的表現性能,就需要很好地選擇和設計網絡結構、學習過程、正則化方法及超參等。另外,隨着任務的不同,工程師需要重複上述過程。

因此,是否可以設計一種AutoML算法,能夠在大量任務上以一致的良好性能進行快速學習,從而減少對人類專業知識的過度依賴?

大賽提供的各類基準數據集

NeurIPS-AutoDL 2019系列競賽的初衷則是希望解決上述問題。競賽提供了一系列可重用的基準數據集,要求參賽選手設計開發無任何人工干預的自動深度學習系統,並使用該系統解決包括圖像、視頻、語音、文本和結構化表格數據等多領域的全自動多標籤分類任務。

論文指出,在有限時間和計算資源的限定下,使用通用的神經網絡搜索(Neural Architecture Search)是不切合實際的,系統需要設計更高級的模塊化組織,包括元學習器、數據注入器、模型選擇器、評估方法等。這些高度模塊化的組件對於元學習、集成學習和有效數據管理十分重要。

「深度賦智」實現了一個基於平均排名、多任務執行和隨時學習矩陣的AutoDL系統(系統架構參考下圖),提供了將用戶數據自動封裝爲系統輸入的端到端開源工具包,以便用戶快速使用AutoDL服務。

參賽解決方案的系統組件圖

其次,論文總結了Top5參賽隊伍的模型選擇方案。我們從下表中看到,幾乎所有方案都對5個領域使用了不同的方法。對於計算機視覺中圖像和視頻這兩個領域,冠軍方案主要採用了諸如ResNet及其變體等流行的主幹網絡,同時引入預訓練模型和數據增強技術。對於語音域和文本域,採用了不同的特徵提取技術,使用領域知識(如MFCC、STFT、截斷)進行特徵提取。對於表格域,將更經典的機器學習算法與智能數據加載策略相結合。

Top5 解決方案總結

同時,作者認爲元學習、數據加載和數據增強是顯著提升模型性能的三大關鍵技術。

  • 元學習(Meta-learning):元學習包括遷移學習、訓練前模型和超參數設置和選擇。元學習對模型訓練和預測的最終精度和速度都至關重要。

  • 數據加載(Data Loading):數據加載是加速訓練過程以獲得更高ALC分數的關鍵因素。系統從三個方面改進了數據加載。首先,加速將數據解碼爲Numpy格式,同時對文本和表格數據進行批處理以加快轉換速度。第二,對不同層次數據和特徵管理採用緩存機制;第三,以漸進的方式提取視頻幀。

  • 數據增強(Data Augmentation):將快速自動增強、時間增強和ThinResNet34模型的分段配置分別作爲圖像、視頻和語音數據的數據增強技術。

爲了論證三大關鍵技術的有效性,作者做了消融實驗進行對比,結果如下圖所示。我們可以看到,元學習可以被認爲是「深度賦智」解決方案中最重要的一個組成部分。分別移除數據加載和數據增強技術,也會使得模型性能降低。

三大關鍵技術消融實驗結果

基於該AutoDL框架,「深度賦智」於2020年4月獲得國際自動機器學習領域的頂級賽事NeurIPS-AutoDL系列競賽總決賽世界冠軍,在多領域測試集上取得了優異的性能表現,證明了該框架在不同場景的普適性。

總決賽Top9 ALC得分

總結

AutoDL的研究面臨諸多挑戰,例如時間和計算資源的限制、最優配置的搜索、網絡結構的設計等等。儘管構建一個完全自動化的解決方案非常複雜,我們還是希望能夠向一個相當統一的模塊化體系結構靠攏。本文的消融研究表明,未來AutoDL在元學習和集成學習方面還可以進一步改進和優化。

目前,「深度賦智」已將該研究成果應用於其自研的天機自動機器學習平臺,已爲零售/鞋服、工業、交易平臺、金融等行業的多個頭部客戶提供了相應服務。客戶數據表明,整套解決方案可大幅提高決策、推薦、搜索等任務的效果,並提升40%~60%的商業指標,爲客戶實現超過60%的人力成本節約和顯著的淨利率提升。

「深度賦智」與其合作學術團隊已經在PAMI/NeurlPS/KDD/ACL/CVPR/ICCV/AAAI等頂會頂刊上發表了數百篇論文,擁有豐富的學術積累。

對於天機產品的潛力與價值,深度賦智創始人兼CEO吳承霖認爲:

“以零售行業爲例,零售行業近幾年經過多輪的轉化與升級,但成本管理難、銷售額增長瓶頸、供應鏈效率低等多個痛點依然存在。

「深度賦智」能全自動部署至線下多個零售觸點,實現更低成本更高效率。”

未來,「深度賦智」將繼續探索前沿科技方向,助力AI技術在各個細分行業的落地,讓AI創造更多的社會價值。

TPAMI介紹

IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI)是人工智能領域最頂級國際期刊,該期刊影響因子在人工智能領域的期刊中常年位居榜首,高達17.861,在中國計算機學會(CCF)期刊會議推薦列表中爲A類。在人工智能領域會議論文日益增多的今天,TPAMI仍維持每年僅200篇左右的錄用量(在中國計算機學會認定的人工智能領域四個A類期刊中排名第一)。

由於微信公衆號試行亂序推送,您可能不再能準時收到AI科技評論的推送。爲了第一時間收到AI科技評論的報道, 請將“AI科技評論”設爲星標賬號在看”。

相關文章