摘要:全棧式工程師在初創公司受歡迎,領域專精的算法人才在大公司很喫香,應用型人才能夠快速提升業務,而工程化是落地的重要一環。很多行業想轉型爲數據驅動或者AI賦能的,藉助於外包或者諮詢公司通常很難成功,因爲缺乏行業經驗,這時從傳統行業轉型到人工智能的應用型人才就至關重要了,他們對機器學習的研究本身就植根於業務需求,所以更接地氣,落地也更快。

  新智元報道

  來源:知乎

  編輯:白峯、夢佳

  【新智元導讀】未來3到5年內,哪個方向的機器學習人才最緊缺?今天我們就來梳理一下。全棧式工程師在初創公司受歡迎,領域專精的算法人才在大公司很喫香,應用型人才能夠快速提升業務,而工程化是落地的重要一環。

  AI專業畢業後好找工作嗎?

  此前,知乎上一位CV專業的985高校研究生曾坦言,當初選擇該方向時,深度學習正處於大熱階段,無人駕駛,人臉識別聽起來就很高大上,似乎人人都想往這方向轉。

  然而,到了找工作的時候,這哥們發現就業形式和他想的相差太大:

  最近陸陸續續有公司開始秋招的提前批了,計算機視覺崗位招的清一色算法工程師,沒有論文,或者大賽獲獎的找到算法崗的簡直不要太難,周圍的同學都開始紛紛轉Java開發,自己也開始慌了。

  想到學了兩年的CV,最後工作找不到,一時間十分失落,感覺如果去做Java開發,還不如本科一畢業就出去工作,完全沒有讀研的必要。

  那麼,機器學習大規模發展是不是隻是個幻覺?未來3到5年內,哪個方向的機器學習人才最緊缺?

  這可能是每個正在學習這個專業的人,最爲關心的。

  華爲雲開發者社區表示,目前機器學習人才還是稀缺。

  每人每天至少產生1G以上的數據,還有大量的數據尚未加以利用。每一個垂直細分的應用場景,都可以通過機器學習產生應用價值。這也就意味着相關領域的人才大量的稀缺。

  總結起來,主要有以下幾個方面的人才最爲稀缺。

  靈活解決問題的全棧工程師

  全棧工程師是指掌握多種技能,勝任前端與後端,能利用多種技能獨立完成產品的人。

  中科院大學,計算機應用技術博士王晉東表示,全棧式的人才最爲稀缺,現在很多搞模型的,或者偏重某一方面的,距離解決實際問題是遠遠不夠的。

  而人工智能全棧工程師比通常意義的全棧工程師更復雜一些,難度也更大,主要是算法實現跟傳統的全棧區別很大,從應用層級來講,分計算機視覺、自然語言處理、語音識別三個大方向。

  細分的話就更多了,計算機視覺方向來說又可細分爲目標檢測、姿態估計、人臉識別等,所以要做人工智能全棧需要投入更多的精力,也需要對各個方向的算法有深刻理解。

  人工智能全棧通常是基於大廠的雲平臺進行開發,人工智能領域很多基礎的組件已經封裝好,對業務和整個項目的架構有了全面瞭解,就可以上手開發了,需要結合業務快速變現的場景,對「全棧」的需求會多一些,在普遍繁榮時期是可以大有作爲的。

  但人工智能全棧工程師發展如何,還要看整個行業大形勢,如果各個方向都開始優勝略汰,「全棧」是缺乏核心競爭力的,因爲算法是別人的。

  專精一個領域的算法人才

  有知友提到,專精一個領域的算法人才會比較喫香。

  這裏算法人才包括算法研究員和算法工程師。

  算法研究員致力於解決更通用,更抽象的問題,如何解決GAN訓練時的穩定性等,而算法工程師更多關注如何解決問題,比如某個場景下出現了badcase,我就想辦法解決問題,是數據預處理,還是參數需要調整。

  此外能快速復現論文結果的算法研究員也是各大公司爭搶的香餑餑。因爲學術界很多新成果只有一個描述,並沒有給出源代碼,想應用它的研究成果,需要自己實現,所以能快速復現論文的算法研究員對公司來說也是很有價值。

  我們去招聘網站搜算法崗,可以大體看出資深算法專家薪資上限很高,但是崗位需求並沒有算法工程師多,畢竟企業還是要賺錢的,所以算法工程師(尤其是推薦方向)也很有市場。

  研究員覺得工程師的活沒技術含量,工程師可能會覺得你天天整些虛的又解決不了問題,紙上談兵。算法作爲一個公司的核心資源,兩者其實都有發揮的空間,跟公司的業務需求關係很大。

  做算法研究也好,工程也好,選對方向很重要,單從行業飽和度來說,圖像也就是視覺方向確實人滿爲患了,語音又特別難,而且缺乏大量的可用數據,自然語言處理方向倒是可以考慮一下。

  一來各種SOTA模型大多針對英語的,到中文有個遷移問題,二來中文跟英文在文法、語義方面存在差異,有很多空白研究領域。

  知乎答主紫杉舉了一個例子,什麼是精通一個領域。

  他的一個名叫伊森的同學,從伊利諾伊香檳畢業(計算機專業名校),讀了兩年計算機研究生,是一位非常優秀,有自學能力的學生。

  結果面試時伊森沒能應聘成功。伊森的背景和很多進入人工智能領域的人很相似。答主分享了下面一段對話:

  最後伊森還問他,如何在一週內精通自然語言處理,然後答主只能告訴他不知道。

  這個例子表明,有些同學擅長快速學習,卻很容易陷入每一個領域都想學的陷阱,到頭來覺得學了很多,實際遇到問題就無從着手,或者浪費很長時間尋找問題根源。

  如何纔算精通一個領域?說自己精通某一領域,在人工智能領域往往是不太恰當的。現在無論是硬件還是算法都在快速的迭代,今天的SOTA明天可能就成兜底了,只有不斷迭代自己的知識,才能跟上業務和場景的發展,讓自己不落下風。

  熟悉業務又懂算法的應用型選手

  另外,既懂算法,又有某一行業的豐富經驗也很重要。機器學習雖然是通用技術,工程師也基本是計算機出身,但落地需要具體到行業應用,如何結合行業實操,解決實際問題。

  中國科學院大學研究員表示,短期內最缺的肯定是應用型人才。

  很多行業想轉型爲數據驅動或者AI賦能的,藉助於外包或者諮詢公司通常很難成功,因爲缺乏行業經驗,這時從傳統行業轉型到人工智能的應用型人才就至關重要了,他們對機器學習的研究本身就植根於業務需求,所以更接地氣,落地也更快。

  中科大研究員舉了一個很生動的例子。

  很多高校的財務人員,每天大量重複性勞動,處理發票、報銷單,將紙質單號手動輸入電子系統裏,過程非常的麻煩。但其實高校及科研單位研究計算機視覺、文字識別、目標檢測的團隊枚不勝數,爲什麼不能用機器學習的方法來節省時間呢?

  這個例子就暴露了一個問題,大多數機器學習研究關注的是模型本身,是否是業界最先進的(SOTA),卻忽視了算法的適用對象以及實際的應用場景。因此,最稀缺的是既懂算法又能將算法進行落地轉化的人。

  答主微調拋出金句「對於絕大部分人而言,努力成爲交叉領域的熟手,比成爲計算機科學家要現實且有意義。」

  學術模型工程化人才

  算法要落地爲產品,還需要模型的工程化,如果這塊能夠深入,那麼必然是不可多得的人才。

  像抖音的推薦系統,如何解決海量數據(603138,股吧)擁堵,移動端優化等工程上有非常多的挑戰。

  結合上文答主紫杉舉的例子。

  Nihil (尼希爾)是另一個他認識的研究生,也是從伊利諾伊香檳大學畢業。他之前在LinkedIn(領英)做大規模搜索(Scaled Search),專門負責把理論算法擴大到工業場景中,擅長搭建後臺,有很強的工程背景。兩年的斯坦福計算機碩士後,現在被Snapchat找去做大規模視頻搜索算法。

  相比於上文的伊森,他是公司更想要的人才。爲什麼呢?

  因爲他在領英和Snapchat這樣的大公司做大規模搜索的算法,這其中的工程難度和實驗室是不可同日而語的。

  任何人都可以跑一個LSTM,但是當訓練數據極具擴張時,LSTM需要跑3天才能見完所有的數據,在這個情況下,就需要更工程化的實現,做分佈式計算或者優化算法本身的效率,使用更快的數據結構等。

  這樣的場景就需要有研究背景的人才,能夠結合學術前沿切實的解決工業上的難題,深度學習50%是學術,50%是工程。現特斯拉AI主管Andrej Karpathy主要就是幹這活的。

  此外,很多人提到調參工程師。

  一位中國科學院大學計算機應用技術博士表示,AutoML越來越受重視,技術含量不高的調參工程師未來很可能被取代。

  最後值得一提的是像Bengio、 Hinton這些深度學習領域的神級人物,當然是很需要,但是這類人才真的是可望而不可及。

  參考鏈接:

  https://www.zhihu.com/question/63883507

相關文章