第一类:统计实验与分析类
工作核心内容一般涉及:
设计、执行并分析统计实验(Statistical Experiment/AB Testing)
设计产品关键指标(Metric);
设计并搭建数据报表
寻找并分析产品问题及用户需求
与之对应的,所需要的核心技能包括:
编程语言:SQL/Hive, R/Python。
软技能:优秀的沟通能力以及跨组协作能力。
统计与分析能力:能将一个商业问题或者产品问题设计成一个统计实验问题,并用数据来回答商业或者产品问题,提供数据驱动的决策。
对于机器学习算法一定的理解
这类岗位是“用数据辅助决策”的典型代表,是帮助公司成为数据驱动型公司的核心岗位,对机器学习算法的要求不高,而是着重统计与分析的能力。同时这类岗位也占北美数据科学家就业市场的半壁江山。
第二类:算法类
这类DS的岗位可能更偏向大众对于DS的理解,也就是以机器学习算法及其建模为主要工作内容。这类岗位的核心工作职责是:
能够完成end-to-end的机器学习项目
能够跟踪并且理解最新的机器学习理论
并开发适合公司应用场景的新算法
而与之对应的核心技能要求便是:
有OOP编程基础
熟悉主流机器学习和深度学习框架
熟悉主流大数据框架
熟悉主流机器学习和深度学习算法
有跟踪和复现最新论文的能力
有将商业问题转化为机器学习问题的能力
对于这类岗位来说,不同的组还会有一些特定领域的机器学习技术的理解的要求。比如有些组要求有较好NLP的技术,有些组要求有CV相关的背景等等。
第三类:混合类
那么是否算法类的DS就不需要懂AB Testing,而做统计的DS就不需要知道ML算法呢?
答案是否定的,大多数情况下对于DS来说这两方面的技术都属于must have,只是不同公司或者同公司但不同组DS有着自己侧重的方面。
对于想在DS这个岗位深耕的小伙伴,不论是机器学习还是统计实验与产品分析,都是需要不断加深理解与学习的方向。