国内外相关高校开设《数据科学》课程、数据科学学位计划、数据科学短期培训班,进行数据科学家和数据工程师的培养。在中国,香港中文大学从2008 年起设立“数据科学商业统计”科学硕士学位;复旦大学从2007 年起开设数据科学讨论班,2010 年开始招收数据科学博士研究生,并从2013 年起开设研究生课程《数据科学》;北京航空航天大学于2012年设立大数据工程硕士学位。在美国,加州大学伯克利分校(UC Berkeley)从2011 年起开设《数据科学导论》课程,并从2012 年起开设《数据科学和分析》课程;伊利诺伊大学香槟分校(University of Illinois at Urbana-Champaign,UIUC)从2011 年起举办“数据科学暑期研究班”(Data Sciences Summer Instituteprogram);哥伦比亚大学(Columbia University)从2011 年起开设《数据科学导论》课程,2013 年起开设《应用数据科学》课程,并将从2013 年秋季起开设“数据科学专业成就认证”(Certification of Professional Achievement in Data Sciences)培训项目,并计划从2014 年起设立硕士学位,2015 年起设立博士学位;芝加哥大学(University of Chicago)开设3 个月的夏季培训课程;纽约大学(New YorkUniversity)将从2013 年秋季起设立“数据科学”硕士学位;南加州大学(South California University)设立“数据科学”硕士学位;华盛顿大学(University of Washington)从2013 年5 月起开设《数据科学导论》课程,并对修满数据科学相关课程学分的学生颁发数据科学证书(Certificate in Data Science);雪城大学(Syracuse University)也提供数据科学高级研究证书(Certificate Advanced Studies in Data Science)培训项目。在英国,邓迪大学从2013 年起设立“数据科学”科学硕士学位。从上述人才 的培养计划来看,数据科学家应该系统地掌握数据分析相关的技能,主要包括数学、统计学、数据分析、商业分析和自然语言处理等,具有较宽的知识面,具有独立 获取知识的能力,具有较强的实践能力和创新意识。其中,只有复旦大学的课程设置强调了数据科学家是研究数据的科学家,而不仅仅是一个数据工程师或者数据分 析师[2](查看中国大数据技术与产业发展白皮书2013原文)。 国内开设《数据科学》课程调研结果 大陆:根据网络调研结果,国内高校目前还没有关于已开设《数据科学》课程的相关资料,但是,不排除个别已经开设《数据科学》课程(因为有些教师可能没有为课程建立主页)。相关高校在数据科学领域开展了相关工作,比如,复旦大学设有“上海市数据科学重点实验室”和“数据科学研究中心”,清华大学数据科学研究院计划在2014年9月开始培养大数据硕士,华东师范大学设有“数据科学与工程研究院”。在教材方面,复旦大学朱扬勇、熊赟等人编写了《数据学》,北京理工大学杨旭、汤海京等人编写了《数据科学导论》。 香港:调研了中国香港几所主要大学,香港大学、香港中文大学、香港理工大学、香港科技大学、香港城市大学、香港浸会大学、香港岭南大学,都没有开设《数字科学》这门课,但是,有几所大学开设了《Data Analysis》这门课,但是并没有课程信息,只有简单介绍。(查看调研报告) 台湾:中国台湾省各高校暂时未开设《数据科学》课程,通过公开的资料也未显示有开课准备。台湾民间有一个“资料科学实验室”组织,2014年召开了“台湾资料科学爱好者大会”,有开设资料科学相关课程。(查看调研报告) 国外开设《数据科学》课程调研结果 美国:华盛顿大学开设了《Introction to Data Science》,介绍了关系型数据库、MapRece、NoSQL、基础数据分析、机器学习、可视化、图论。约翰霍普金斯大学在Coursera上一口气推出了9门Data Science方面的课程,组成“数据科学家”专项课程。(1)数据科学家的工具箱;(2)R语言程序开发;(3)获取和整理数据;(4)探索性数据分 析;(5)可重复性研究;(6)统计推断;(7)回归模型;(8)实用机器学习;(9)数据产品开发。纽约大学开设MS data science项目。哥伦比亚大学设有数据科学学院。MIT开设Introction to Computational Thinking and Data Science(计算思维和数据科学导论)这门课,介绍如何利用计算机来理解真实世界的现象,目标受众是具备一定Python编程经验和计算复杂度基础知识的学生,课程强调必须更加照顾涉猎范围,而不是一味增加深度;为了这个目的,该课程会为学生提供许多主题的浅显介绍,这样学生就可以知道之后在他 们的职业生涯中可以用计算机去完成什么样的任务了;课程的主题包括,绘图、随机程序、概率和统计、随机漫步、蒙特卡洛模拟、数据模型化、优化问题和分类归 并。哈佛大学开设CS109 Data Science,有GitHubk课程资料。(内容请查看调研报告) 英国:目前大概有七所高校开设了《数据科学》及其相关课程,包括谢菲尔德大学、爱丁堡大学、伦敦大学学院、东英吉利大学、布里斯托大学、曼彻斯特大学、 伦敦大学皇家霍洛威学院。其中,谢菲尔德大学和爱丁堡大学对于这一新兴专业归纳最全,并设立了相应的MSc;其他高校只设立了与数据科学相关的一些课程或专业,如曼大设立了数据与知识管理专业,东英吉利大学设立了知识发现与数据挖掘专业。(内容请查看调研报告) 韩国、日本:经过对韩国科学技术院(KAIST)、浦项大学、首尔国立大学以及日本东京大学和京都大学的网络调研,可初步得出,韩国和日本目前还没有高校开设《数据科学》的课程。其中,韩国的三所大学有设立与数据科学相关的课程,但没有课件资料,也没有简要的课程介绍。(查看调研报告)