电子工程机械物理等专业如何改行做数据科学家
电子工程专业有的方向比如信号处理,会用到很多统计、机器学习的方法和模型,如果转去做热门的数据科学,其实很有优势。
不光是电子工程,应用数学、机械、物理、工业工程和运筹学等专业的同学,都可以做数据科学家。一亩三分地里甚至有人发帖提问:为何data scientist很多是学物理出身的?
其实,如果你玩得了统计、懂得了数学、建得了模型、写得了程序,就应该能找到data scientist工作。请注意,Warald说的是“写得了程序”,没说“你写程序必须得很牛才行”。要成为全栈数据科学家的确是很难的,但是如果作为职场新人,能做到各方面都懂一点或者学有专长,就可以了。如果你背景合格却在挣扎着找工作,Warald觉得是你自身求职策略和方法有问题,需要改进。
很多同学要问:我转专业去读计算机或者统计并不现实,但是想跨行业成为数据科学家,应该如何做准备?一亩三分地数据科学版资源很丰富,很多人给过很具体很详细的建议。
在《码农背景想做数科的怎么补统计?》里,小K说:
1. 如果你有办法在学校上课,就上课,学基本概率,比较基本的统计,make sure 要cover: exploratory data analysis (EDA), descriptive statistics and inference.
Inference里面,如果你只想会最基本的,学t-test、CLT、chisq test (for proportions)、pvalue and power
线性代数不一定非要学,虽然学了也好。
ML你如果学过计算机的,也可以自己再看一个统计的 (intro to stat learning with R, Tibshrani)2. 如果实在没办法选课,udacity都有descriptive statistics and inference两门。EDA在其他数科track里面都有cover,不妨把MongoDB的课也上了。作业不免费但是录像都有。
Udacity intro to stat 实在太浅了,差评不推荐。除非你看前面两门课觉得看不懂,否则没必要。
这些就是minimal set,剩余还有兴趣的看兴趣学。比如可以看这个帖子 http://www.1point3acres.com/bbs/thread-102389-1-1.html
henry_xjtu说
针对想做ML相关的Data Scientist, Michael Jordon给的这个书单就不错:
In particular, I recommend A. Tsybakov’s book “Introduction to Nonparametric Estimation” as a very readable source for the tools for obtaining lower bounds on estimators, and Y. Nesterov’s very readable “Introductory Lectures on Convex Optimization” as a way to start to understand lower bounds in optimization. I also recommend A. van der Vaart’s “Asymptotic Statistics”, a book that we often teach from at Berkeley, as a book that shows how many ideas in inference (M estimation—which includes maximum likelihood and empirical risk minimization—the bootstrap, semiparametrics, etc) repose on top of empirical process theory. I’d also include B. Efron’s “Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction”, as a thought-provoking book.
joyce说:
data scientist 三个主要素质要求, statistical expertise, hacking skills, domain knowledge.说过 前两个需要系统专注地学习, domain knowledge 是完全可以利用零散的时间积累, 比如每天睡前看两个wikipedia 上的relative term, 地铁上看篇blog, 或者 google搜索下行业内的popular问题.
地里还有一个起了高楼的帖子:《Data Scientist 炼成记录》,里面信息就更丰富了,各种资源列举的很详细。
其实信息就在地里,就在你手边。想做数据科学家,就得投入时间去实践和学习。
– Warald (Email: iamxiaoning@gmail.com)
博客: http://www.1point3acres.com
微博:http://www.weibo.com/warald
欢迎转载,转载必须在标题注明转载,在文章正文开始之前而不是最后,用不小于正文的字体大小,肉眼可以清楚识别的颜色,一字不漏的附带文章末尾的版权声明,包括作者ID、博客网址和原文链接。否则视为侵权!感谢合作。