红杏劫
哈佛大学数据科学专业: 数据科学是一门蓬勃发展的新兴学科。它一方面研究数据本身,包括数据的各种类型、状态、属性、变化形式和变化规律;另一方面通过数据揭示自然界和人类行为的现象与规律,从而为自然科学和社会科学提供新的研究方法。随着人类进入大数据时代,数据科学在各行各业中发挥的作用日趋重要,各行业对数据科学人才的需求急剧增长,数据科学家迅速成为热门职业。 课程设置: 项目是由Computer Science 和 Statistics 以及 the Institute for Applied Computational Science 联合授课,开设在哈佛的 Arts and Sciences 学院下。学生需要在3个学期内完成12门课、 培养目标: Build statistical models and understand their power and limitations Design an experiment Use machine learning and optimization to make decisions Acquire, clean, and manage data Visualize data for exploration, analysis, and communication Collaborate within teams Deliver reprocible data analysis Manage and analyze massive data sets Assemble computational pipelines to support data science from widely available tools Conct data science activities aware of and according to policy, privacy, security and ethical considerations Apply problem-solving strategies to open-ended questions数据科学专业的就业前景 全球3431373930最顶尖管理咨询公司麦肯锡 (McKinsey) 出具了一份详细的分析报告,预计到 2018 年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在 14 万 到 19 万 之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到 150 万 ! 其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、 IT 技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是 6 位数了 ( 美元 ) 。数据科学的三类职业方向:机器学习、数据分析和数据科学家 1. 机器学习工程师 Machine Learning Engineer 代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要 ship proction code ,做出来的是数据产品。 2. 数据分析员 Data Analyst 工作内容俗称 analytics (proct analytics or business analytics) ,从数据中提取 insight ,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写 SQL query 取数据、用 R/Python 做简单的分析、用 Tableau/Excel 作图比较常见,能自己开发 Dashboard 算是 analyst 里面技术强的 ; 工作需要产生各种形式的报告 ; 在统计层次上,懂基本 t-test 和线性回归即可。 3. 数据科学家 Data Scientist 很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如 Uber 叫车的 ETA 、各种定价系统、 Airbnb 和金融行业的 Fraud Detection 、 Amazon 物流管理, FB/Linkedin 的社交网络或者 ebay/Airbnb/Uber 这样供需双方 Marketplace 市场规模的实验。这些例子,听上去就不是写 SQL 能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。