猿族星球data岗位之等级划分:DL monkey > ML monkey > DS/Analytics monkey > SQL monkey

一亩三分地里有同学发帖说:

听了很多留学培训机构讲座,听上去DS很有前途,。。。感觉转DS做data scientist(data scientist我默认是做机器学习,会涉及到统计知识,但是我看过一些面试题,本科期间学的统计知识基本够用。面试拉差距主要还是机器学习和算法)会比直接转CS平稳。到研究生快结束找全职前,我已经有三份美国中小公司实习经历,两份机器学习相关,其中一份是Data scientist Intern。届时身边认熟悉的同学有四五个是机器学习相关的实习。。。简历关全跪。无心插柳投的软件开发,倒是收了很多面试,最终我个人是软件开发上岸,认识的人没有数据上岸或者机器学习上岸的。我曾经在招聘网站上搜索关键字,软件开发岗位是数据科学岗位的五倍还多。另外,数据科学家岗位学历普遍要求更高。

跟data 沾边的岗位和专业都跟多,而且很多说法很模糊,比如这位同学也提到的 Data Science = Machine Learning;以及学业DS的、学统计、学CS的、学EE的,都说有ML背景,等等。

在这里,Warald做个划分。

《1》Machine Learning Engineer

公司里很多做ML的职位叫 Machine Learning Engineer,可以认为是 Software Engineer with a specialization in Machine Learning,换言之,MLE跟mobile, front end一样,可以理解为是SDE的一个track。面试当然要刷题,最对口的专业当然是CS。

就工作内容而言,只有硕士学位、工作经验也不丰富的MLE,一般做不了model和算法,做的是实现。很多EECS PhD,做的也不是建模,依然是ML system development。

有的公司里也有专注做ML建模的组,一般要求phd,但是这样的职位很少。

《2》Data Engineer

data engineer这个title在不同公司意义不同。

有的是SQL,论收入 SQL << Data Scientist < SDE。 有些公司里,data engineer做data pipeline/platform的开发,是个软件开发的工作,跟MLE、mobile、 front end一样,也可以认为是SDE的一个technical track,这种职位被称为DI(Data Infrastructure)收入当然跟SDE看齐 - 所有的SDE technical tracks应该都是同一个收入标准。 《3》Data Scientist data scientist 情况更加复杂和混乱。 DS里最高端的是职位俗称“建模”,但问题是公司里哪有那么多模型给人建?职位太少了。所以,学统计、学data science专业的同学们,找建模的工作非常难,即使有PhD。 在很多行业、很多公司,DS其实只是 data analyst or market/business analyst,无非是给了个好听的title。工作内容SQL为主、写点简单的R或者python就算高难度技术活了。这些是DS里的低端职位。尤其是非互联网公司,基本都是此类职位。 搁在中间的DS职位,在互联网公司里俗称 analytics。 在facebook, DS是二等公民,因为收入比 SDE低一级,也就是说, DS的level 5,收入参考SDE level 4。一亩三分地每日答题里有一道题目,就是针对这个情况设计的。 但在Airbnb, DS跟SDE同等级同收入。 在这两家,DS做的事情其实是类似的。既然类似,为什么A家地位高?DS们可以设计metrics来衡量一个产品的impact,但是DS工作本身的impact是很难客观衡量的,所以全看公司设置,看领导们怎么看待。 现在analytics待遇最好的地方,应该就是Airbnb了。你会看到不少人在FB工作几年去Airbnb,那怕在表面上是平级移动,比如 FB DS 5 -> Airbnb DS 5,用收入衡量,其实是 FB SDE 4 -> Airbnb sde 5,跳槽涨钱了。

去Airbnb做DS = 从各种公司去FB/Google做SDE。

无论FB还是Airbnb,都不怎么招 new grad,因为analytics最好懂有实践经验,工作内容不是 ”用某个统计方法解决某个问题“,而是诸如:

Facebook打算给用户的发text notification 告诉他们close friends 的Update, 如何评估这个feature 值不值得加?
一亩三分地是否应该上每日答题这个feature?如何衡量?

现在的data science项目课程应该没有哪家是解决以上问题的吧?然后学生们一脸懵逼,不知道怎么解决此类问题。只能去做低端的analyst,给个数据集写SQL,close ended questions更容易handle。

《4》未来的方向

Data Science:
个人感觉今后趋势是往FB靠近,远离Airbnb。当然,这个还是要看公司、看职位,如果是一个写的了代码 + 做的了分析的人,其实是非常宝贵、非常难得的。相信会找到适合你的职位。

ML:
最牛逼的人,会逐渐集中在Deep Learning。
DL和ML是不一样的。Linkedin有很多MLE,它家的MLE质量很棒,但是大部分人不做DL。
做DL比较多的行业,比如无人车 – 无论无人车啥时候落地,DL总归是技术前沿。

Software Engineer 里的track:Data Engineer和 Machine learning 甚至前些年Mobile,都曾经出现过短时间的人才缺口,也都迅速填上了。
MLE前两年奇缺,很多人公司比如FB也提供内部training,帮助员工做ML。
DL 门槛高很多,估计填坑速度会远比ML慢很多。DL Engineer目前很抢手。有机会入行的同学,应该毫不犹豫跳进。

总结:

DL monkey 是monkey中的monkey,拥有跟多个公司配对的权利。
ML monkey、DI money,跟mobile monkey, front end monkey等,作为主流,身强力壮者,也有跟多个公司配对的权利。
Analytics monkey,R monkey,市场需求会一直在,但在猿族星球里会逐渐变成 second class monkey,憧憬着可以去圣地Airbnb。那里据说香蕉很多,鸟语花香,还跟 engineer monkey平权。
SQL monkey 是最不值钱的monkey – actually,猿族里很多人认为SQL非我族类,也好意思叫monkey?

– 一个年老monkey的胡言乱语。

– Warald (Email: iamxiaoning@gmail.com)
博客: http://www.1point3acres.com
微博:http://www.weibo.com/warald
一亩三分地iOS应用:https://appsto.re/us/EesS8.i
一亩三分地安卓应用:https://goo.gl/g7Rfnq
欢迎转载,转载必须在标题注明转载,在文章正文开始之前而不是最后,用不小于正文的字体大小,肉眼可以清楚识别的颜色,一字不漏的附带以上三行内容。否则视为侵权!感谢合作。