面经内容
【一面】(40分钟)
更多是考察数理统计方面的,还记得的问题如下:
1.偏态数据如何处理?
2.K-means聚类过程
3.分类算法有哪些?
4.SVN的核函数的定义和作用?
5.LR回归公式的推导
6.线性判别模型
7.两个向量间的相似性计算方法?优缺点分别是什么?
8.A/B test 为啥用t检验?
【二面】(60分钟)
1、现场给了几道sql题,让我白板写sql
这里就用掉了20多分钟,估计面试官看完我简历和笔试卷后,觉得只能考我sql的数据处理逻辑了
还有有leecode的实践经验,这里做的比较满意。
2、sql中where和having的相同点和差别点?不用distinct 语法怎么实现distinct相同的功能?
3、有了解过hadoop么?数据倾斜是如何发生的?
4、spark为啥比hive快?所有条件下都成立么?
5、对机器学习感兴趣么?
【三面】(45分钟)
主要是分析方法和实际案例题
1、有在微信内看过公众号文章么?微信订阅号改版,文章底部有相关文章推荐,你会怎么评估?
这里暗自窃喜。因为听从师兄建议后,下载了各种app使用去体会。日常使用微信的过程中也注意到这一现象,也演练过。
答:我会从两方面评估
1、是推荐的效果。需要文章的曝光log,文章曝光后的点击log,简单计算转化率。
2、是大盘阅读效果。需要有A/B test,对比无推荐/有推荐的用户,最终的阅读量是否有明显差异。需要有用户阅读文章的log。
2、如果文章推荐转化率高,大盘阅读量没有提升或者有提升,你觉得原因是什么?
一开始,我不知道怎么回答。后来冷静下来,给出了几个猜测,基于我平时使用习惯的体验
1、可能用户日常阅读时间有限。有推荐,用户看推荐的文章。无推荐,用户会去看订阅列表和朋友圈的文章。导致总体阅读量没有差别
2、用户还有朋友圈等场景可以看文章。系统推荐后,朋友圈等场景下降。结果一增一减,总体没多大变化
这个开放式题目回答一般。虽然平时有做练习,但遇到实际数据问题,自己思考深度还是不够。
3、了解AARRR模型么?
4、有看什么数据分析的书籍么?
5、大学跟导师过哪些项目?主要负责哪些东西?
这个大家一定要注意,面试官会追着你问各种细节。大家写简历的时候,最好如实回答,不要吹大。另外,做过的项目,大家也要回顾。如果有过项目经历,当时做这个项目,用了哪些方法,优缺点是啥,怎么改进等等。
6、有使用过短视频么?从哪里可以获得抖音、快手、微信视频号的数据?怎么评价3者的竞争?
7、列联表的独立性检验
8、微信支付某天的支付总量同比发生5%的下降,你会怎么查找原因?
【HR面】(30分钟)
1.对面试官的评价?
2.大学成绩
3.对自己的评价?
4.为什么想来腾讯?
5.个人的职业打算?
6.兴趣和性格?
7.有女朋友么?女朋友在哪里?
8.什么时候能来实习?
总的来说,HR的问题,网上给的八九不离十,大家平时注意归类,然后有自己的答案即可。
总结
1、找实习、找工作,是个很持久的事情。身心都会很疲惫,大家一定要调整好心态。
2、温习书本,对于基础理论,一定要注重推导和逻辑过程。另外书本后面的习题,即使做过了,多做一次会加深记忆过程
3、leecode等网站,多去刷题
4、作为学生的我们,基础知识理论往往不缺,但缺乏实际中用到的数据分析方法和业务思维。
而笔试和面试过程中,往往会涉及一些实际分析案例,考察我们的分析逻辑。
数据分析师的岗位技能要求
基础知识
基础知识包含数学、线性代数、统计学等,这些也是决定数据分析职业发展高度的基石。对于初学者,学习描述统计相关的内容和公式即可,再进一步就需要掌握统计算法,甚至是机器学习算法。对于算法相关的工作,则要对高数进行深入学习。
分析工具/编程语言
Excel是运用最广,也是最容易入门的数据分析工具之一,函数、数据透视表和公式必须熟练掌握。另外,还要学会一个专业统计分析工具,SPSS作为入门学习是比较好的。不过随着数据的增长,编程语言的学习将会使数据处理变得更加高效。