今天,來自斯坦福AI Index年度報告的AI人才需求居然在兩年暴漲了35倍!

事實上,近年來AI愈發火熱已是不爭的事實,業內對AI人才的猛烈需求也並非無跡可尋——AI人才薪資待遇一路領先、居高不下;企業人才爭奪戰事激烈、手段出奇。

據中新電商分析:從去年開始,斯坦福大學主導、來自MIT、OpenAI、哈佛、麥肯錫等機構的多位專家教授,組建了一個小組,每年發佈AI index年度報告,全面追蹤人工智能的發展現狀和趨勢。

“我們用硬數據說話。”報告的負責人、斯坦福大學教授、前任谷歌首席科學家Yoav Shoham談到這份最新的報告時表示。

今年的報告,從學術、工業、開源、政府等方面詳細介紹了人工智能發展的現狀,並且記錄了計算機視覺、自然語言理解等領域的技術進展。

▌報告要點

一、美國AI綜合實力最強

  1. 美國的AI論文發佈數量雖然不是第一,但美國學者論文被引用的次數卻是全球第一,比全球平均水平高出83%。
  2. 2018年美國AI創業公司的數量,比2015年增長2.1倍。而從2013年到2017年,美國AI初創企業獲得的融資額增長了4.5倍。均高於平均水平一倍以上。

二、中國AI追趕速度驚人

  1. 清華2017年學AI和機器學習的學生數量,是2010年16倍。
  2. 70%的AAAI論文來自美國或中國,兩國獲接收的論文數量相近,但中國提交的論文總量比美國多30%。
  3. 基於經同行評議論文數據庫Scopus的數據,2018年發佈AI論文最多的地區是歐洲(28%)、中國(25%)和美國(17%)。
  4. 與2000相比,2016年中國AI學者論文被引用的次數,提高了44%。
  5. 中國一年的機器人部署安裝量,從2012到現在增長了500%。ROS.org來自中國的訪問量,2017年比2012年增加了18倍。

三、全球AI發展提速但仍不均衡

  1. 2017年,全球ML人才需求已經是2015年的35倍。
  2. 整體來說,自2016年以來,美國、加拿大、英國政府在國會/議會會議中對人工智能和機器學習的提及激增。
  3. 80%的AI教授是男性,統計數據來自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和蘇黎世聯邦理工學院。
  4. 美國AI工作崗位的應聘者中71%爲男性。

看過這份報告之後,人工智能大牛吳恩達總結了兩點:

  1. AI正在快速發展,不管是學術界還是工業界都是如此。
  2. AI的發展仍不均衡,在多樣性、包容性方面仍需努力。

以下是這份報告的主要內容▼▼▼

▌AI論文情況分析

發表總量增長迅猛

從1996年到2017年,CS領域的年發表論文增長了約五倍 (6x) ,AI領域的年發表論文增長了約七倍 (8x) 。對比一下,所有學科的年發表論文總量增長了不到兩倍 (<3x) 。

劃重點,AI論文的年發表量,比CS論文增長要快。

各地區AI論文發表情況

2017年,Scopus上面的AI論文,有83%來自美國以外的地方。具體數據是,28%來自歐洲,25%來自中國,17%來自美國。

從2007年到2017年,中國的年發表AI論文數增長了150%。

細分領域論文發表情況

2017年發表的AI論文中,有56%來自機器學習與概率推理這一研究方向。

對比一下,2010年發表的AI論文,只有28%來自這個方向。

另外,圖表裏顯示的大部分研究方向,在2014-2017年間,複合年均增長率 (CAGR) 比2010-2014年要高。

比如,神經網絡這一方向的論文發表數量,2014-2017年之間,複合年均增長率達到37% (如圖中紅色曲線) ,最爲突出。

做個對比,在2010-2014年之間,神經網絡論文發表數,複合年均增長率僅有3%。

arXiv論文

自2010年以來,arXiv論文總體呈現迅速增長,從2010年發佈的1,073篇,到2017年發佈的13,325篇,增長超過11倍 (12x) 。許多細分領域也呈現增長。

這表示,論文作者們傾向於把自己的研究成果傳播出去,不論是經過同行評審還是在AI會議上發表的論文。這也體現了,AI這個領域競爭激烈的特質。

在細分領域中,計算機視覺 (CV) 是自2014年起增長最快的一個 (上圖藍色曲線) ,從1,099篇增長到2017年的4,895篇,漲幅近400%。

AI論文引用量

FWCI是領域權重引用影響係數,可以用來衡量論文的影響力。

報告重新定義了一種“改裝版” (Re-based) 的FWCI,不按地區,而按世界平均值,來計算影響力。

在這個標準之下,雖然歐洲發表的AI論文數高於中國和美國,不過論文影響力曲線比較平緩;相比之下,中國發表的論文影響力增長劇烈:與2000年相比,2016年平均每位中國AI論文作者的引用率增長了44%。

不過在這方面,美國依然全球領先,美國AI論文作者的平均引用率,比世界平均值高出83%。

AAAI論文

AAAI 2018,提交論文,中美佔70%,中選論文,中美佔67%。

中國的論文提交數高出美國約1/3,但二者中選論文數相差無幾,中國入選265篇,美國入選268篇。

▌高校AI課程註冊情況

AI和ML進軍高校的速度提升了不少。

報告顯示,截止到2017年底,AI課程註冊人數是2012年的3.4倍,ML課程註冊人數是2012年的5倍。

其中,UC伯克利的ML課程的註冊人數增長最快,是2012年的6.8倍,但此數值較2016年增長速度有明顯下降。

報告進一步統計了非美國地區院校AI+ML課程註冊人數的變化。結果顯示,清華是非美國院校外增長率最高的高校,幾乎是第二名多倫多大學的2倍。

縱向對比來看,清華2017年AI+ML課程註冊人數是2010年的16倍。

▌學術會議熱度

在大型會議中,NeurIPS (曾用名NIPS) 、CVPR和ICML,是參與人數最多的三大AI會議。自2012年以來,論參與人數的增長率,這三者也領先於其他會議。

NeurIPS和ICML參與人數增長最快:將2018年與2012年相比,NeuRIPS增長3.8倍 (4.8x) ,ICML增長5.8倍 (6.8x) 。

上面討論的是大型會議,但小型會議的參與人數同樣有明顯的增長,甚至可以比大型會議的增長更加明顯。

這裏最突出的是,ICLR 2018的參會人數達到了2012年的20倍。

原因很可能是近年來,AI領域越來越關注深度學習和強化學習了。

▌AI創業投資情況

從2015年1月到2018年1月,人工智能創業公司的數量增長到了原來的2.1倍,而所有活躍的創業公司增長到了原來的1.3倍。

大多數情況下,創業公司的增長都保持相對穩定,而人工智能創業公司呈指數級增長。

在風投資金方面,從2013年到2017年,人工智能領域的風投資金增長到了原來的4.5倍,而所有的風投資金只增長到了原來的2.08倍。這些數據都是年度數據,不是逐年累積的。

圖表中有兩個高峯期,1997-2000年風投資金的激增,對應的是網絡泡沫時期。2014-2015年出現了一個較小的增長,因爲當時正處於一個相對較大的經濟增長時期。

▌人才需求

報告顯示,近幾年,社會需要的AI相關人才大幅度增加,目前對有ML技能的人才需求最大,其次是深度學習。

可以看出,ML人才需求也是這兩年增長速度最快的。

報告統計,2017年,全球ML人才需求是2015年的35倍,從2016年到2017年的增幅尤爲明顯。全球對AI人才的需求在2016年驟增。

▌專利

2014年,大約30%的人工智能專利發明人來自美國,其次是韓國和日本,各擁有16%。

在韓國和中國臺灣地區,專利的增長速度較快。2014年人工智能專利的數量幾乎是2004年的5倍。

▌財報電話會議中提及AI和ML的次數

2015年,科技公司在財報電話會議中提及AI和ML的次數開始有所增加。

2016年,其他行業提及AI次數纔開始增長。

相比之下,科技行業的公司提及AI和ML的次數遠比其他行業多。

在財報電話會議中,除了科技行業之外,提及AI次數最多的公司,基本上分佈在消費、金融和醫療保健行業。

▌機器人安裝量

2012年到2017年,中國機器人年安裝量增長了500%,其他地區,比如韓國和歐洲,分別增長了105%和122%。

在安裝量較小的地區中,中國臺灣比較突出,在2012-2017年增長最快。

▌開源框架GitHub標星數

各框架的標星數反映着他們在開發者羣體中的流行程度。不過,因爲開發者們日常不會“取關”GitHub項目,所以這些星星都是多年來積攢下的。

我們可以明顯發現,TensorFlow的受歡迎程度在開發者中遙遙領先、穩步增長。

排除了第一熱門,第二名和第三名分別是scikit-learn和BVLC/caffe。

TensorFlow官方力推的keras排到了第四,但近一年來幾無增長勢頭。

另外兩大熱門PyTorch和MXNet分別排到了第七和第六,尤其是PyTorch,作爲一個年輕的框架,自2017年初發布以來至今,GitHub標星數至少增長了4倍。獲取新用戶的勢頭很猛,不知道其中有多少被TensorFlow逼瘋的人類。

▌各類任務最新成績

這個部分分爲CV和NLP兩塊,分別列舉了各主流任務從發展之初到現在的成績進步情況。

ImageNet圖像識別準確率

2017年是ImageNet比賽的最後一屆,2018年這項比賽就不再進行了。不過,驗證集依然有人在用。

圖中,藍色的線條爲ImageNet挑戰賽歷年的成績變化,由於每年比賽所用的數據不同,旁邊多了一條黃色線條,是以ImageNet 2012驗證集爲評價標準繪製的。

可以看出,到2015年,機器在圖像分類任務上的能力已經明顯超越了人眼,而即使比賽不再繼續,學術研究者依然在認真推進該任務的表現。

這也側面說明,如果一項工作有了明確的評價標準和固定的挑戰內容,研究者們圍繞此競爭,更容易讓技術在該領域取得突破。

ImageNet訓練速度

這張圖是訓練ImageNet圖像分類神經網絡所需時間的歷年變化(當然,是買得起足夠計算資源的人和機構所用的時長)。

從2017年6月的1小時,到2018年11月的4分鐘,ImageNet圖像分類神經網絡的訓練速度提升了16倍,除了硬件方面的貢獻,算法上的提升也不容小覷。

圖像分割COCO

ImageNet挑戰賽“退休”之後,CV領域的朋友們就把重點放在了微軟的COCO,挑戰語義分割和實例分割。

四年來,COCO數據集上圖像分割挑戰的精確度已經提升了0.2,2018年的成績比2015提升了72%。不過,目前還沒有超過0.5,這一項還有充足的進步空間。

另外值得一提的是,COCO比賽近年來佔據冠軍位置的多是來自中國的公司,包括曠視、商湯等計算機視覺獨角獸日常包攬數個項目的冠軍。

語法分析(Parsing)

在確定句子結構這種語法分析的任務上,2003年到2018年的15年間,AI的表現(F1 Score得分)提升了將近10%。

機器翻譯

在機器翻譯任務上,報告拿英語-德語互相翻譯舉例,評估了AI模型在經典機器翻譯評估算法BLEU標準中的表現。

報告顯示,2018年英語轉德語的BLEU評分是2008年的3.5倍,德語轉英語成績是2008年的2.5倍。

機器問答:AI2 Reasoning Challenge(ARC)

在問答領域,AI表現進步更明顯,可以按月計數了。

報告統計了2018年從四月到11月間,AI在ARC推理挑戰賽上成績的變化:簡單組得分從63%提升到69%,挑戰組得分從27%提升到42%。

這些,都僅是半年間的進步。

機器問答:GLUE

同樣用於機器問答的GLUE基準(General Language Understanding Evaluation)推出至今只有7個月的時間,但目前的表現已經比半年前提升了90%。

GLUE的推出者、紐約大學助理教授Sam Bowman說,雖然圍繞GLUE的大型社區還沒有出現,不過已經有了像谷歌BERT這樣的代表性技術用了GLUE基準,面世一個月內已經被引用8次。在EMNLP會議中,GLUE時常被討論,可能會成爲語言理解領域中的一個基準線。

▌政府提及

整體來說,自2016年以來,美國、加拿大、英國政府在國會/議會會議中提及人工智能和機器學習的次數激增。

2016年之前,機器學習很少被提及,與人工智能相比,機器學習在總提及量中只佔很小的一部分。

查看原文 >>
相關文章