大约从2009年开始,每个人都在说“大数据”,
无论是手机、平板电脑还是各种设备的数据传感器,
以及物联网、云计算、移动互联网这些概念都与大数据有关。
这不,offer大圣今天一打开朋友圈
就看到这样一条扎心的面试动态
大数据时代的到来,将颠覆人们现有的逻辑和工作
将逐渐成为现代社会的基础
就像望远镜让我们能够感受宇宙
显微镜让我们能够观测微生物
任何领域对data science都会成为刚需
在未来这一领域对人才的需求无疑也将是空前盛大
那么,商科专业的同学能转data science吗?
如何搭上这列高薪工作的升职快车?
最适合职业发展路径,莫过于成为一名data analyst
商科学生转data science能做哪些工作?
马云曾在卸任时的演讲中提到:“很多人还没搞清楚什么是pc互联网,移动互联网来了;我们还没搞清楚移动互联网的时候,大数据时代又来了。”
data science 的职位可以分为:
除了最适合商科学生的data analyst
还有data scientist
以及data engineer
data architect
data administrator
business analyst
data/analytics manager
business intelligence manager
1data scientists(挖坑)
这个职位更经常存在于it部门,或者干脆自己组成一个部门。职责是解决一切data analyst解决不了的比较复杂的问题。且他们通常是不需要负责定期出报告来分析季度数据的。
他们的终极目标是搞出一个高大上的模型,然后可以自动的预测未来趋势。
主要工作:从business部门那里收集有趣的/亟待解决的问题。询问data analyst“你们部门平时都用那些数据,那些前端系统”,然后和data engineer商量我们需要从数据库x,y,z里面获取m,l,n表,最后生成一个包含a,b,c变量的表来给我作分析。然后用各种升起的统计方法解决问题。同时也还是要生成好看/好用的最终报告。
2data engineers(填坑)
data engineer所做的一切都为了data management,具体内容包括数据模型、数据架构、数据标准、元数据、主数据、数据治理、数据管控等等。
data enginner的目标是把数据整好,存储成本低,查询效率高,至于怎么使用这些数据不是他们关心的范畴。
主要负责:database architecture,data modeling,data quality check, data cleaning, data enrichment/transformation(aggregation, join...) 等等后端的工作。
3data analyst(数坑)
data analyst偏重于将分析和商业运用相结合,分析只是一个手段和途径,更加重要的是将分析的结果转化为切实可行且能有所成效的商业方案。
所以类似职位的面试有些类似于,基于技术面试题基础上的咨询类型的case study。从分析中找到可能存在的风险,并提出解决方案比起完美的code有时候更加重要。更加适合非技术出身的求职者。
同样是做data analyst的工作,在不同的公司,要求的技能和工作的内容会很不一样。
微软online service division有跟marketing更接近的data scientist,也有很多学统计或者ie出身的applied scientist做randomized controlled experiment;
linkedin、facebook的data scientist感觉要求java编程技术熟练,可能学computer science出身的最适合;
insurance行业招的是predictive modeler,他们的总体目标就是要基于数据,预测在不同客户身上收多少保险费能最大化收益、optimize profits,所有相关专业的它们都考虑。
所以在求职阶段,要根据自身的特长和喜好选择对应公司的analyst team;而在求学阶段,更要提早准备好自己的职业发展目标,去有针对性的学习data的相关专业知识;才能趁早锁定dream offer!
从事data science有哪些必备技能?
优秀的编程能力常常能体现一个人在统计学知识的沉淀,也能展现出他的思维是否严谨。一般具备以下几项能力的求职者,在data science领域都能拥有广阔的发展空间,以及令别人垂涎的高薪待遇:
sql
hadoop
python
java
r
来看看薪资:
最高8w一个月是什么水平?
以下是各个具体职位对于应聘者技能的要求:
1data scientists(制造砖头)
实际而言,统计分析知识最好要接近于statistical phd的等级。
技术知识要能写r,写python,不仅仅是写普通的统计分析程序,至少要能为这其中一个写点企业专用的package,最好还能和data engineer就数据库和r之间的架构和代码转换问题干上一架
2data engineers(搬砖)
所以除了传统的数据库知识(sap,oracle,能编程(sql, mysql, java, python...),大数据背景下,最好要知道hadoop相关的技术知识并且不断更新(比如比较热门的:spark, kafka, lambda architecture...),然后专精一两个。
3data analyst(数砖)
skill set中对于本行业的了解的重要性要远高于对于统计分析方法的了解的重要性。excel和ppt肯定要玩得好。reporting和visualization工具还是知道多一些的比较好,比如老牌的microstrategy和比较新的tableau。
重点是:要能快速的产生漂亮且简单易懂,直切重点的分析报告。其次,你要会用一些工具,基础的比如spss,也有人用excel干回归分析的。或者高级一点sas,最好还能写点code。
4真实data职位jd
offer大圣在以下列举了几个招聘data相关职位的job requirement
deloitte - data scientist
requirement:
bachelor's degree in computer science, engineering, mathematics or otherbusiness-related field
strong problem solving and trouble shooting skills with experience exercising mature judgment
demonstrated ability to write clearly, succinctly, and in a manner that appeals to a wide audience
proficiency in word processing, spreadsheet, and presentation creation tools, as well as internet research tools
ts/sci is required
preferred:
prior professional services or federal consulting experience
experience with: sql; python; r; vba; hadoop
familiarity with electronic warfare, techelint, or openlint are also desirable
goldman sachs - data team, analyst/ associate
basic qualification:
excellent technical skills (ms access, excel) required, basic understanding of sql and computer language(s) a plus
excellent time management and prioritization skills; detail-oriented
knowledge of sql, relational databases, program logic, file layouts preferred
quick learner who excels with hands-on responsibilities
strong communication skills
exhibits sound judgment and integrity
preferred skills:
previous experience or coursework in a quantitative field a plus
mckinsey - data analyst - banking analytics
qualifications:
hand-on experience in an analytics role in banking is strongly preferred;
strong academic qualifications, including advanced understanding/coursework in math, statistics, machine learning and data management
proficiency in python, sql, r and/or sas; additional knowledge of other data mining software (spark, scala, etc.) is a plus
advanced knowledge of machine learning /statistical techniques, data mining, (gradient boosting, random forest, deep learning/ai, regression, decision trees, text mining, etc.)
exposure to credit bureau, online, mobile, and social data is helpful
skills to communicate complex ideas effectively
留学生如何进入这一高薪热门行业?
一般情况下,毕业生入门需要从 analyst 做起,主要是为 data scientist 做基础的数据准备工作。上手之后会逐渐接手一些更偏重分析和建模的内容。
一方面你有比较强的编程背景,另一方面你有比较好的数理基础。还要在行业内积攒背景。
如果一点语言基础都没有可以从pasacal 入手,因为它是一门脚本语言,相对于其他编译语言来说,比较好上手,而且处理数据来说还是有比较大的优势的。
data science
21世纪最好找工作的职业领域
就业率基本高达99%
平均高达薪资14万加币
上升趋势快,未来空间大,积累性高
最容易给海归的offer之一
神秘虚幻的数据让人感到对未知的恐惧
“不了解”造成的“不敢尝试”
其实对智慧型的中国留学生来说
求职data相关工作才是更有优势和竞争力
送你
20g+ data求职福利大礼包
1
10g excel数据分析教程
从excel database/excel data analysis
到excel business analytics
从基础教学到高级教程,全方位学习
2
12g sql/r/python/sas/java/spss高清教程
12g精讲教学视频
任君选择,更有针对性学习
合计230讲,求职data必备技能都在这了
3
dbc 独家整理1000+data面试真题&面经合集
涵盖:google/amazon/ibm/linkedin/bloomberg/facebook等名企
data等相关热门职位真实面经400+份
囊括:600+data science面试真题
sas/r/spss/sql/python理论&实践面试真题合集
附送: 12本machine learning教科书
福利领取方式
私信我!