data science是一门及其综合的学科,也就是现在炒得很火的“大数据"。其对口职位叫数据科学家,也就是“data scientist”。Data Scientist面试考察的内容很杂,我们要从各个领域全面地去准备,不要留下短板。那国外顶尖的科技公司对数据分析师有哪些技能要求?
1.SQL
大家可能觉得Data Scientist都在做深度学习模型,并不经常用到SQL,但事实不是这样。Data Scientist要花大量的时间用SQL抓取数据,可能是做一些直接的分析,也可能是为建模做准备。
SQL是非常重要的技能,每一个公司的面试都会考。你需要熟悉掌握这些语句:Case when, Group by, Having, Self join, Left outer join, On vs Where等,这些是面试中比较常考的。在学校里涉及得SQL语句一般比较简单,没有侧重这些语句,比如一个Select from where,加上一个Join就结束了。但在实际面试中,会问一些比较难的问题,比如Left outer join。大家一定要知道什么时候用Left outer join,以及on和where的区别。
Case when也是用得非常多的语句,用于实现简单的逻辑功能,有时候会嵌套很多层。有些SQL问题乍一听比较难,并且你摸不着头绪,这时候可以试试Self join,这种问题往往用Self join可以解决。
2.R/Python
有同学可能会问,这两种语言只会一种行吗?必须两者都会吗?肯定是最好两种都会。
公司里普遍是一半的人用R,另一半人用Python。如果你只会一种,你和另外一半同事合作就会有些困难,读他的代码就会吃力。虽然面试的时候,面试官会让你根据自己的喜好选择一种语言,但对于提升自己的实际能力来说,两种都掌握是最好的。
这里有几个Package大家需要熟悉,R的Package有Ggplot2和Dplyr,面试时有些公司会让你当场用R写一些东西,如果你熟练运用这些Package用得很好,会给你增加优势。Python的Package有 Pandas, Scikit-learn, Matplotlib。
3.A/B testing
实际工作中可能会大量地做A/B testing,而这恰恰是在学校涉及得比较少的。有很多拥有丰富的A/B testing工作经验的人会发一些博客,大家可以去读一读。
4.Machine Learning
最常用的两个模型是Linear Regression和Logistic Regression,需要熟悉它们的数学逻辑。其他的模型当然也要了解,但用得并不是特别多,比如Random Forest等。
5.Experiment Design
Data Scientist一般会和Product Manager合作设计实验,在设计实验的过程中,你需要思考实验中涉及到的Feature是想要改善哪个指标,在什么时候、呈现给哪些用户。在实际工作中,存在一些难度比较大的实验设计,这就要依靠Data Scientist的个人经验,也可以在博客中看看别人实际的工作经验。
6.Business Sense
我们在学校做的项目,数据一般比较完美,并且老师会帮你制定项目的框架。但在实际工作中,原始数据会存在很多问题,你会找不到头绪。这时拥有一些Business Sense,比如对公司的核心指标比较敏感,会对数据分析有一些帮助。
7.Product Sense
这一点对于应届生来说可能是最难的,因为它需要通过工作经验来积累。比如产品的什么Metric是你最看重的。大家需要通过实习或者阅读文章来积攒经验,Quora上经常有关于这方面的讨论,比如某产品最关注的Metric是什么,以及为什么。
8.Communication
沟通能力是把你的想法和发现分享给其他人的能力,可以通过更多的演讲和Presentation来锻炼。并且要根据你的听众选择不一样的讲述方式。如果你的听众是其他Data Scientist,你就可以介绍一些项目的细节。但如果是Director,他可能没有领域知识,不会对那些细节感兴趣,而是更看重结果,所以这时你就要用一些直白的话讲述你的发现。
Data Scientist面试对口语的要求相对较高,表达时还要有清晰的逻辑,如果口语不好,你就无法将你的技术能力很好地向面试官展现出来。
资讯来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:850873385进行删除。
Copyright © 2014-2018 500d.me. All Rights Reserved.