Data Science三类职业方向:机器学习、数据分析和数据科学

2013年,Warald写文章介绍过数据科学做什么?需要什么核心技能?

2015年,我又谈了如何成为全栈数据科学家?如何选择公司团队来培养自身的能力?

根据Warald了解的信息,数据科学经过这些年的迅速发展,已经分化成三类工作职位。今后几年,这种划分应该会更明显。

《一》数据科学的三个职业方向

1. 机器学习工程师 Machine Learning Engineer

代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。

2. 数据分析员 Data Analyst

工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。

3. 数据科学家 Data Scientist

很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。

此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理,FB/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。

《二》三个方向的对比

从工资收入高低来看,1和3都很高,2要低一些,尤其是非IT行业,工资明显低很多,工作地点如果也不是热门地区的话,可能只有1和3的一半。

从工作机会多少来看,近期内对1的需求很高,今后几年内也会保持;2散布在各个行业,加起来也不少;3其实是少数派,职位很少,往往只有大公司才需要,中小型公司可能不需要,即使需要的话,有少数几个人也就够了。

从读什么专业、拿什么学位角度来看,1包含“会一些ML的软件工程师”和“会写生产代码的机器学习专家”两种,也就是说,侧重点会有差异,但是机器学习和软件开发技能都需要。有EE或者CS博士学位最佳,统计等计量学科博士,如果辅修了CS master,也合适。如果只有EE/CS硕士学位也可以,但是硕士生们需要额外自学很多机器学习知识才能胜任,只靠在学校里简单上一两门课,可能不够。此外,找工作的时候,也需要一些运气成分才能找到合适的岗位。

2一般是统计、数据科学、商务分析、工业工程等专业的硕士担任。

3一般是统计、运筹、经济、工业工程、EE、CS等专业的博士担任,需要某领域的深刻理解。

《三》如何在三个岗位之间转换?

如果你做的是1,考虑到工资收入高,能接触到系统的核心(比如LinkedIn是如何给大家推荐工作的),你很可能不会主动考虑换岗位,当然,如果有机会往3靠近,做点新东西,或者处理更上层、更有全局观的问题,很多人会考虑。

有人可能会问,硕士生们,在2类岗位工作几年以后,是否可以从事3?这个要看具体情况,但是整体难度非常大。有一个道理相信很多人都明白:基础工作做1000遍,不代表你能从事高级工作,典型的例子是用天天写SQL产生report,写上3年,不代表你能做建模。此外,很多公司看到你的最高学位是硕士,很可能不会考虑你,不给你机会。

3类工作也并非完美,最大的问题在前面说了,工业界职位少,换句话说,你跳槽可能没有几个选择;当然,公司要招有经验的人,合适的candidate也少。如果要往1转,最大的障碍是编程能力如何,能否写production code,如果本身就是EECS出身,那会很容易。

– Warald (Email: iamxiaoning@gmail.com)
博客: http://www.1point3acres.com
微博:http://www.weibo.com/warald
欢迎转载,转载必须在标题注明转载,在文章正文开始之前而不是最后,用不小于正文的字体大小,肉眼可以清楚识别的颜色,一字不漏的附带以上三行内容。否则视为侵权!感谢合作。