IT公司招聘数据科学家看重什么背景?LinkedIn、Facebook、亚马逊、谷歌、微软挨个数,兼谈统计专业面试问题

小K在一亩三分地数学统计版帖子《[from NCES]近5年来统计学位增长了将近1倍半》里分享了她了解的几大IT公司对Data Scientist的不同要求:

linkedin 对data scientist编程要求很高,我已经听说好多熟人被刷下来了,我都没敢试

facebook据说也这样。基本data scientist职位要的其实是dev

amazon就有实实在在的statistician了,基本都是建模,不是dev,但是用脚趾头也知道,mapreduce要懂点,不然数都取不出来还分析个头。没人成天给你把数据整成规规矩矩的长方形,漂漂亮亮等你分析。。。当然a家活居多,很累。

Google大家都知道,是不明文要求啥,具体标准是啥不清楚。对统计本身能力还是非常看重的。但是一个在里面混的很好的人告诉我,如果进去之后能写py,自己把自己分析出来的insight实现成production code,你就会被很看重。进去之后有学习这个的意愿别人也会教你的。其实想想也知道么。。。。

MS招的这个方向的人很多部门都有,对编程要求有高有低。有建模成分很大的职位,这种的感觉技术含量比较高。但是我小样本的gossip听说也是忙的一塌糊涂。有编程和统计都要用的部门。跟amazon一样,也有那种主要SQL取数据的职位。当然个人觉得这种事情比较无聊。。。做久了只怕很烦。并且被技术含量高的部门(正式内部职称是所谓研究员researcher)“鄙视”说他们都是PM. haha….

这个帖子里还有更多关于统计学习、数据科学家技能的讨论,比如统计专业的面试

最近有朋友跟我提起面试情况,都有这么个态度“他们为什么要问我blabla问题”,觉得自己答不上来的问题是别人问的不合理。

比如:明明知道我是用R实现一些算法的,为什么要问我logistic regression如何evaluate model performance的问题?
我惊诧了,我觉得这是perfectly reasonable的PhD level statistician问题啊。然后我问他,你回来把这个问题搞清楚了吗?他说:我觉得这个问题问的很无聊,反正面试已挂,我就没再看。
我又惊诧了,面完了不管挂没挂,难道不需要搞清楚自己答不上来问题的答案么。Intellectual curiousity 总要满足吧。。。。

另外一个朋友说的也很类似,态度就是:他们为什么不问我我会的东西,问那些其他东西有什么用。。。。。。。可是雇主关心的是,你能不能做他们要的事情,而不是你会做什么。显然不会以你为中心来提问。

传统面试让phd学生来讲论文做了什么,其实有多少是直接能用上的?phd research方向一般都比较窄,实话说又多少人能听懂?(不排出有这种情况,这种你会非常被珍惜!!)

现在比较流行是直接考查将来工作里遇到的情况,你能否解决。你的基础知识是否牢靠(比如google quantitative analyst注明的手工推算ols variance)。假设一种情况你来分析解决(某某数据,你如何来分析?怎么建模?要检查什么assumption? 违反了怎么办?怎么衡量模型是否好?用什么方式来把结果告诉别人)。甚至具体动手解题(白板)。

感兴趣的同学,别错过《[from NCES]近5年来统计学位增长了将近1倍半》!