相信任何对科技行业新闻感兴趣的职场人士,都不会对“大数据”和“人工智能”这些词汇感到陌生。尽管这两项技术至今仍然没有业内公认的标准定义,但是几乎所有人都认同,它们在未来的重要性将越来越高,无论在个人生活还是职场中,职场人士都需要了解它们、利用新技术,无可否认的是,全新的数字经济即将到来。

波士顿咨询公司(BCG)发布的《数字经济下就业与人才研究报告》从就业人群、就业领域和就业方式三个方面分析了数字技术可能对就业生态产生的影响和变革,对于数字经济下的就业人群,拥有“特定专业技能(尤其是数字技术相关技能)”对获取中高端就业机会至关重要。

同时,根据领英发布的《中国数字人才现状与趋势研究报告》显示,数字人才按价值链流程的不同职能可以分为六类:数字战略管理、深度分析、产品研发、先进制造、数字化运营和数字营销。

中国85%以上的数字人才分布在产品研发类,深度分析、先进制造、数字营销等职能的人才加起来不到5%。

当这些“高大上”的新职位扑面而来,是时候谈一谈那些能够利用这些技术解决真正业务问题的人才。

大数据和人工智能的背后:现代数据科学的组成元素

一贯秉持“通过科学的方式运用数据驱动业务运营和有影响力的决策”理念的领英数据科学与分析团队一直在高速发展,也一直在吸引顶尖人才加入,共同创建领英“全球经济图谱”,并对经济图谱进行分析研究,为企业人力资源管理者提供人才洞察,为企业提供更好的经济机会。

在领英看来,数据科学家需要掌握哪些核心技能和能力才能胜任这一职位?如何运用系统方法和工具实现智能分析? 数据科学家能为企业人力资源管理带来哪些有效分析和洞察?

第一,数据整理/数据加工/数据转换

尽管这些技能听起来不像“数据科学”那么酷,并且大家会用各种不同的名称来称呼它们,但是这是一位数据科学家必须具备的核心技能。它包含了一系列理解和整理数据相关的技术和知识,从而为后续进行深入分析、数据挖掘、机器学习等所需的一系列工作奠定良好的基石。

和理论研究的场景不同,在真实的商业世界里很少能够得到“完美”的数据。如果你身处日新月异的科技行业中,这一点尤为明显。数据科学家需要充分了解数据的商业应用背景,才能对其进行解读、清洗,并转换为可使用的形式。

这个工作听起来容易,但其实并非如此。很多时候,仅仅在这一个步骤,就要占据整个项目半数以上的时间(假定数据科学家已经具备熟练技能并且一开始就按照正确程序操作)。

领英在这一挑战面前也并不例外。一般情况下,领英会让候选人才完成一系列数据操纵工作,包括使用SQL、R或Python等编程语言进行数据整合、分配、排序等,展现他们在此领域内的能力。这一测试的目标并非检验精确的编程语法,而是考察候选人是否懂得正确的流程方法和思考过程,以及结合业务理解进行合理决策的能力。

第二,实验设计和A/B测试

数据科学家必须具备一定的统计知识,尤其是需要针对不同商业应用场景设计实验,并开展A/B测试的基础技能。因此,每名团队成员应该能够理解基本统计概念,例如,假想检验、平均值/中位值、方差、概率分布、样本规模计算、统计功效计算,实验设计和分析等等,并在商业实例中进行具体的应用。

人才不仅应拥有上述问题的理论知识,还需要主动利用这些知识,以科学方式指导产品研发。例如,他们应当能够设计成功指标、制定实验计划、提供及时洞察将实验从小规模初步实验扩大至覆盖100%用户的正式实验,并且根据实际情况进行迭代分析从而开发出用户满意的产品,最终取得预期商业回报。

对于初级数据科学家,领英更关注的是候选人才对关键统计概念的基本理解,以及在真实应用案例中是否具备商业头脑。

对于高级数据科学家,希望人才能够具备相关产业经验和深入的统计知识,不仅能够了解挑战及问题,还应当有能力提出解决方案,推动商业目标的实现。

第三,统计建模/机器学习

为了顺利完成工作任务,一名数据科学家应当具备统计建模或机器学习能力。领英希望候选人才有能力把一个业务问题转化为机器学习问题,选择适当建模算法,并遵循正确的训练、测试和验证流程建立模型。

一般而言,分析团队的数据科学家不会把大部分时间花在建模这一工作中。但是,我们也发现,了解机器学习算法,并且将其应用于具体商业案例是一名数据科学家取得职业成功的重要因素。

如果对此问题了解不足,就很容易出现对数据的错误解读,甚至造成对业务有所损害的决策,以及不佳的用户产品体验。人们常常提到的 “错误的数据比没有数据更有危害”就是在阐释这一道理。

其次,了解各种算法的优缺点,例如逻辑回归、线性回归、决策树、深度学习等知识,针对各种需要解决的业务问题选择最适合的机器学习算法也极其重要。

第四,软技能(非技术技能)

对于数据科学家而言,不仅会考察技术、能力等一系列的“专业能力”,还会深入评估候选人的沟通、项目管理和影响力等软能力,这些“软能力”的重要性与“专业能力”不相上下。

要成为一名成功的数据科学家,需要根据从数据中获得有价值的发现有效地影响他人,这往往是促进数据驱动的决策文化中最具有挑战的部分。

在考察数据科学家时,经常采用的问题包括:你如何使用清晰、简明的方式整理和发布个人的发现;在相关决策人没有被分析结果打动时,你该如何应对;如何回答非技术人员提出的关于算法/方法论相关的问题;在一个项目偏离计划的情况下如何进行管理并使之重回正轨?

总体来说,对于数据科学家而言,需要最终利用分析获得洞察,有效影响具有业务影响力的关键决策者。一名数据科学家需要同时运用其“专业能力”和“软能力”,将数据分析得以真正落地,才能取得职业上的成功。

第五,案例研究及解决问题

对于希望成为数据科学家的人才而言,这并不是一份容易的工作,需要深入了解数据及其相关商业应用场景,通过数据驱动的有效方式解决问题。这需要具备良好的业务领域知识、批判性分析思维、熟练开展根源分析、并能够就分析成果进行有效沟通,从而影响商业决策的制定和执行。

因此,通常企业会采用案例研究的方式测试候选人是否利用正确的分析方法和合理的数据直觉解决商业案例的能力,以及能否根据数据洞察提出相关可操作建议的能力。

案例研究将来自产品、营销或销售等实际的商业运营领域。测试一般采用模块式设计,人才可自行选择一个自身感兴趣或者较为熟悉的业务领域,从而充分展现个人的商业头脑。

作者:李玥

作者系LinkedIn领英数据科学与分析总负责人

相关文章