做数据科学家,硕士和博士学位有啥区别?

读了前面关于数据科学的文章,相信你也能明白,拿到博士学位,更有利于做data scientist。

比如同样是学统计出身的,作为master你可能做的是底层工作,接触不到太多核心的东西,工作基本内容可能就是用SQL倒腾数据、在R 里面做点初步处理,而PhD们职位起点高,上来就是做统计分析、建模等高级工作。这个跟统计/生物统计的master和phd出路也类似:前者很典型的工作是SAS programmer,后者直接是statistician or biostatistian,可以参考Warald以前的一篇贴子《统计和生物统计硕士博士出路比较》,尽管Data Scientist是个新职业,但是道理大体一致。

同样是学CS出身,master们成为软件工程师,做的是底层的实现,尤其是公司的新人,系统框架早由高手们搭好了,来了coding的活你就去做,你考虑问题的范围很小,就是如何写好你负责的code 。而PhD们,可能是Research SDE、Applied Scientist/Researcher(这个是微软的title),跟其他的组合作来实现核心的Machine Learning或者Information Retrieval系统,一般都被要求能独立思考,能针对一些问题提出自己的想法和解决方案,老板也很鼓励你去创新、会给你自由让你探索新的project。

另外,越是技术上比较先进的公司,往往越是倾向于招收博士,提供的职位也更高级,待遇更高。如果是硕士生,往往得有几年工作经验才会被考虑 – 刚毕业的硕士,无论哪个专业的,只是修了些硕士层次的课程,可能达不到公司的要求。

当然,无论是master or PhD,找到什么样的工作,也看你的个人能力。找不到research SDE职位、只能去做普通SDE的PhD有不少,甚至找不到工作的也有;master们也有摆脱“常规路线”获得很好发展的,一亩三分地论坛里最好的例子就是Joyce不做SAS programmer,成为market research analyst。Warald这里想强调的是:PhD们机会更多,概率更大,在Data Scientist这类职业上,远比master有优势。

如果你是master学历,拿到多个job offer有得选择的话,建议考虑一下长远发展,比如一个大公司让你去用SQL倒腾数据,给8万美元一年,另一个公司让你做统计分析,给7万一年,Warald的建议你从了后者,对工资、公司名气不满意的话,过两年跳槽就是了。

有些公司,尤其是大公司,可能会提供较多的training(技术培训)机会,如果你的技能,跟《数据科学家需要的三大核心技能:Data Hacking、Problem Solving and Communication》有明显差距,那应该尽量利用培训机会。公司培训的缺点,一个是课程过于应用,对于你迅速学会写Java程序很有帮助,但是对于复杂点的知识,比如MCMC、machine learning,公司基本都没法培训的,不如在学校里系统的学习。而且,你的日常工作如果就是去写SQL倒腾数据、写java程序实现各种function,你也没啥精力去研究工作上根本用不到的Casual Inference、SVM,就算你研究了,也没有机会去用,无法获得深入的理解。

建议大家一定要摆脱做底层工作,争取做高级点的。否则,写上5年SQL,跟花上5年时间做分析和建模,将来出路会有很大差别的。下面就是这个data science系列文章最后一个话题:《数据科学家能挣多少钱?

– Warald (Email: iamxiaoning@gmail.com)
博客: http://www.1point3acres.com,微博:http://www.weibo.com/warald
欢迎转载,转载必须在标题注明转载,在文章正文开始之前而不是最后,用不小于正文的字体大小,肉眼可以清楚识别的颜色,一字不漏的附带以上三行内容。否则视为侵权!感谢合作。