相信任何對科技行業新聞感興趣的職場人士,都不會對“大數據”和“人工智能”這些詞彙感到陌生。儘管這兩項技術至今仍然沒有業內公認的標準定義,但是幾乎所有人都認同,它們在未來的重要性將越來越高,無論在個人生活還是職場中,職場人士都需要了解它們、利用新技術,無可否認的是,全新的數字經濟即將到來。

波士頓諮詢公司(BCG)發佈的《數字經濟下就業與人才研究報告》從就業人羣、就業領域和就業方式三個方面分析了數字技術可能對就業生態產生的影響和變革,對於數字經濟下的就業人羣,擁有“特定專業技能(尤其是數字技術相關技能)”對獲取中高端就業機會至關重要。

同時,根據領英發布的《中國數字人才現狀與趨勢研究報告》顯示,數字人才按價值鏈流程的不同職能可以分爲六類:數字戰略管理、深度分析、產品研發、先進製造、數字化運營和數字營銷。

中國85%以上的數字人才分佈在產品研發類,深度分析、先進製造、數字營銷等職能的人才加起來不到5%。

當這些“高大上”的新職位撲面而來,是時候談一談那些能夠利用這些技術解決真正業務問題的人才。

大數據和人工智能的背後:現代數據科學的組成元素

一貫秉持“通過科學的方式運用數據驅動業務運營和有影響力的決策”理念的領英數據科學與分析團隊一直在高速發展,也一直在吸引頂尖人才加入,共同創建領英“全球經濟圖譜”,並對經濟圖譜進行分析研究,爲企業人力資源管理者提供人才洞察,爲企業提供更好的經濟機會。

在領英看來,數據科學家需要掌握哪些核心技能和能力才能勝任這一職位?如何運用系統方法和工具實現智能分析? 數據科學家能爲企業人力資源管理帶來哪些有效分析和洞察?

第一,數據整理/數據加工/數據轉換

儘管這些技能聽起來不像“數據科學”那麼酷,並且大家會用各種不同的名稱來稱呼它們,但是這是一位數據科學家必須具備的核心技能。它包含了一系列理解和整理數據相關的技術和知識,從而爲後續進行深入分析、數據挖掘、機器學習等所需的一系列工作奠定良好的基石。

和理論研究的場景不同,在真實的商業世界裏很少能夠得到“完美”的數據。如果你身處日新月異的科技行業中,這一點尤爲明顯。數據科學家需要充分了解數據的商業應用背景,才能對其進行解讀、清洗,並轉換爲可使用的形式。

這個工作聽起來容易,但其實並非如此。很多時候,僅僅在這一個步驟,就要佔據整個項目半數以上的時間(假定數據科學家已經具備熟練技能並且一開始就按照正確程序操作)。

領英在這一挑戰面前也並不例外。一般情況下,領英會讓候選人才完成一系列數據操縱工作,包括使用SQL、R或Python等編程語言進行數據整合、分配、排序等,展現他們在此領域內的能力。這一測試的目標並非檢驗精確的編程語法,而是考察候選人是否懂得正確的流程方法和思考過程,以及結合業務理解進行合理決策的能力。

第二,實驗設計和A/B測試

數據科學家必須具備一定的統計知識,尤其是需要針對不同商業應用場景設計實驗,並開展A/B測試的基礎技能。因此,每名團隊成員應該能夠理解基本統計概念,例如,假想檢驗、平均值/中位值、方差、概率分佈、樣本規模計算、統計功效計算,實驗設計和分析等等,並在商業實例中進行具體的應用。

人才不僅應擁有上述問題的理論知識,還需要主動利用這些知識,以科學方式指導產品研發。例如,他們應當能夠設計成功指標、制定實驗計劃、提供及時洞察將實驗從小規模初步實驗擴大至覆蓋100%用戶的正式實驗,並且根據實際情況進行迭代分析從而開發出用戶滿意的產品,最終取得預期商業回報。

對於初級數據科學家,領英更關注的是候選人才對關鍵統計概念的基本理解,以及在真實應用案例中是否具備商業頭腦。

對於高級數據科學家,希望人才能夠具備相關產業經驗和深入的統計知識,不僅能夠了解挑戰及問題,還應當有能力提出解決方案,推動商業目標的實現。

第三,統計建模/機器學習

爲了順利完成工作任務,一名數據科學家應當具備統計建模或機器學習能力。領英希望候選人才有能力把一個業務問題轉化爲機器學習問題,選擇適當建模算法,並遵循正確的訓練、測試和驗證流程建立模型。

一般而言,分析團隊的數據科學家不會把大部分時間花在建模這一工作中。但是,我們也發現,瞭解機器學習算法,並且將其應用於具體商業案例是一名數據科學家取得職業成功的重要因素。

如果對此問題了解不足,就很容易出現對數據的錯誤解讀,甚至造成對業務有所損害的決策,以及不佳的用戶產品體驗。人們常常提到的 “錯誤的數據比沒有數據更有危害”就是在闡釋這一道理。

其次,瞭解各種算法的優缺點,例如邏輯迴歸、線性迴歸、決策樹、深度學習等知識,針對各種需要解決的業務問題選擇最適合的機器學習算法也極其重要。

第四,軟技能(非技術技能)

對於數據科學家而言,不僅會考察技術、能力等一系列的“專業能力”,還會深入評估候選人的溝通、項目管理和影響力等軟能力,這些“軟能力”的重要性與“專業能力”不相上下。

要成爲一名成功的數據科學家,需要根據從數據中獲得有價值的發現有效地影響他人,這往往是促進數據驅動的決策文化中最具有挑戰的部分。

在考察數據科學家時,經常採用的問題包括:你如何使用清晰、簡明的方式整理和發佈個人的發現;在相關決策人沒有被分析結果打動時,你該如何應對;如何回答非技術人員提出的關於算法/方法論相關的問題;在一個項目偏離計劃的情況下如何進行管理並使之重回正軌?

總體來說,對於數據科學家而言,需要最終利用分析獲得洞察,有效影響具有業務影響力的關鍵決策者。一名數據科學家需要同時運用其“專業能力”和“軟能力”,將數據分析得以真正落地,才能取得職業上的成功。

第五,案例研究及解決問題

對於希望成爲數據科學家的人才而言,這並不是一份容易的工作,需要深入瞭解數據及其相關商業應用場景,通過數據驅動的有效方式解決問題。這需要具備良好的業務領域知識、批判性分析思維、熟練開展根源分析、並能夠就分析成果進行有效溝通,從而影響商業決策的制定和執行。

因此,通常企業會採用案例研究的方式測試候選人是否利用正確的分析方法和合理的數據直覺解決商業案例的能力,以及能否根據數據洞察提出相關可操作建議的能力。

案例研究將來自產品、營銷或銷售等實際的商業運營領域。測試一般採用模塊式設計,人才可自行選擇一個自身感興趣或者較爲熟悉的業務領域,從而充分展現個人的商業頭腦。

作者:李玥

作者系LinkedIn領英數據科學與分析總負責人

相關文章