评估角度:
1、工作内容
2、工作的产出形态
3、工作的上下游
4、所需要技能
5、评价你工作的指标
好,我们就从这5个角度来看:
一、工作内容
数据分析师:百度百科上的定义是:“数据分析师 是数据师Datician['detɪʃən]的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。”
数据分析师关注点是数据,要对数据进行搜集、整理、分析。 注意,这里都是人做分析,哪怕用一些 R/sas/spss/python工具,进行编程或不编程的工作,也是人在做分析,最终形成的,是对业务的洞察。
数据分析师形成的结果,往往是各种报表。
数据科学家,也是要对数据进行相关的工作,不过更多站在建模的角度上,进行预测性的动作。数据分析师更多对历史数据的分析和挖掘,形成认知,数据科学家在数据分析师基础上,增加了预测方面的事情。特别是对用户个体层面的预测。个体层面的预测,是数据分析师往往做不了的事情,但是个体层面的预测,才有实战性的业务价值。
算法工程师,往往是要对算法的业务效果进行调优,是最直接接触业务效果的,他要综合利用数据分析、算法选型、算法上线和调优、平台工具,甚至使用业务知识,进行综合性的业务效果调优,算法工程师承担的责任是最大的。
二、工作的产出形态
数据分析师:1、分析报告;2、BI报表为主
数据科学家:1、分析报告;2、BI报表;3、业务视角的产出模型,对一些业务内容进行模型生产
算法工程师:一套系统,在线的推理系统,以及离线的一套生产模型的pipeline。必要时候也许 产出一些报告和BI报表,但主要职责是让这套系统的业务目标获得提升。
三、工作的上下游
数据分析师:上游是大数据工程师,数仓工程师等,从他们那里获取数据;下游是 业务人员,以及公司的管理层。
数据科学家:上游是大数据工程师,数仓工程师等,数据科学家获取的更注重用户个体角度的数据;下游是业务人员,数据分析leader,公司业务线管理层,甚至算法工程师。
算法工程师:上游基本和数据分析师和数据科学家差不多,下游是直接的业务人员,因为要为业务效果负责。
四、所需要的技能
数据分析师:百度百科上有不少:基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。不过平时主要的分析,还是AB对比分析。各种角度的统计。
数据科学家:数据分析师所需要的能力+机器学习算法等
算法工程师:数据科学家所学要的呢里+算法的工程系统建设的知识+业务领域的实施细节,算法工程师,需要对算法、数据、业务、工程 都有较好的把握,在你的手中形成一个综合的生产留存,满足业务效果指标。
五、评价工作的指标
数据分析师: 管理层认为你的分析报告好即可。分析报告深入,BI报表有参考意义。
数据科学家:静态的建模效果指标。例如对一个分类数据的 AUC等,回归数据集的MSE等。
算法工程师:业务指标效果。直指业务,责任重大。