一、纽约大学纽约大学(NYU,New York University),位于美国纽约市,是一所世界顶尖私立研究型大学,是培养众多学者、艺术家和作家的摇篮。纽约大学共设有230多个专业,文理学院的哲学系位列全美第一;艺术学院的表演、电影导演专业也为世界一流,在纽约的生活学习和其他美国城市是不太一样的,反而和在中国的大都市比如香港、上海更加贴近,所以在地理位置上像理工科及商科专业的就业情况也是很有优势的。二、课程培养目标/录取要求纽约大学的数据科学项目主要开设为有硕士项目和博士项目,都属于STEM项目。 硕士项目主要针对于拥有数学/计算机科学/应用统计学为背景的本科生或工作人士, 旨在学习数据科学领域的最新方法和研究体系。申请者可以根据自身情况选择全职full-time student 或者兼职part-time student。 硕士项目采用学分制,全职学生需要在两年内修够36个学分, 兼职学生需要在五年内修够36个学分。硕士项目还为学生提供六个具体的专业方向,分别是大数据方向,数学方向,自然语言处理方向,物理方向,生物方向(18年秋季开设)和医学信息学方向(19年秋季开设),每个专业方向有对应的选修课,学生修完选修课就可以拿到该专业下的专业证书。博士项目在2017年秋季开设,是全美数据科学专业第一个博士项目,旨在培养数据科学领域的领路者,或者在某一特定领域,例如NLP(自然语言处理),CV(计算机视觉),大数据等方面的杰出人才。录取要求:纽约大学的数据科学项目会结合学生的专业背景、学习数据科学的动力、GPA、GRE,托福等各方面成绩综合考量。基本上如果是国内本科的话gre 320+ /325+, 托福100以上 。美本背景的不需要托福成绩,GPA3.3以上。学姐当时申请的时候本科gpa 3.85 ,gre 331+3.5,托福105,供大家参考。除了这些硬实力外,学校也非常注重申请者的软实力。文书最好能多体现个性化的东西,以及自己对数据科学的理解,为什么对这个项目感兴趣,学校录取你的理由,你的竞争力如何等内容。学校主要希望从文书里找到跟项目的研究方向,文化背景相匹配的申请者,一些非理工科背景的同学或是已经工作了五六年想提升自己来自其他行业的申请者,也都有机会被录取。学校特别看重的,是申请者对这个项目的热情和喜爱,大家一定要在文书中体现出来。三、就读感受及建议首先在学业上,大家一定要认真对待每一门课程,课上积极与教授沟通互动,尽可能给教授留下印象。很重要的一点是一定要认真完成每一次的作业和练习,尽量早点开始,遇到问题可以和同学沟通,不要等到作业马上要e才想起来还有作业要做。通过做作业可以检验自己的学习质量,巩固知识点,查漏补缺,非常重要。其次要学会充分的探索利用学校的资源,比如图书馆。学校的图书馆提供海量的纸质书籍和电子资料,是一个值得开放利用的宝地。再者就是要多和身边人沟通,和项目负责人教授多交流,有时候会有意外的惊喜和收获。最后就是建议大家多去参加系里举办的各种活动,比如研讨会,经验交流分享会等等,通过这些活动可以认识更多的人,开阔视野,有时还可能会有工作机会,比如内推。
目前数据科学家或者数据分析师岗位还没有饱和,所以需求量挺大的,招聘全年都有,每年春招和秋招是旺季,毕业生会在这两个时间点比较集中的参加面试大多数同学找工作的方式是求职网站投递,但更高效,回复率更高的方式是校友或者专业人士内推,这就需要大家平时多参加活动,多与人交流,为自己积累人脉。数据科学方面的岗位在纽约和加州(尤其是湾区)需求比较大,原因是这些地区Tech公司比较多,而现在tech公司都已经认识到了当今大数据时代,数据的重要性。那么就业去向有哪些呢?(一)就业去向就业去向主要集中分布在纽约,湾区,西雅图这些地方。工作岗位主要与数据相关,比较多样化。其中数据科学家最多,也有一些有大数据经验的去做数据工程师,还有一小部分有计算机背景的转行去做了软件开发工程师SDE。有相当一部分同学去了Apple, 甲骨文(Oracle),微软这种大型的上市科技公司,也有去银行/电商/医药等公司的。还有非常少一部分同学选择了毕业直接以应届生身份回国发展,主要去了阿里巴巴。数据科学比较热门,因此工作机会比较多,再加上开设数据科学项目的学校还不算多,纽约大学的这个项目就业率和就业发展都是很可观的。求职资源第一,招聘会。数据科学项目内会在各个学期期中或者期末举办一次招聘会,多是请纽约当地的公司,或是校友及教授供职公司来参加。同时文理学院也会在每年的春季和秋季学期安排一到两次特别大型的招聘会,届时会请上百个公司来参加。学校一般会提前告知所有的公司信息,招聘要求以及摊位位置。参加大型的招聘会前,大家一定要提前做好功课,找好自己对口的岗位和公司,有目的性地去投送简历。第二,校友人脉。校友们大都集中在纽约地区和旧金山/洛杉矶地区。项目会安排一些校友回校互动,因此要多关注邮件。同时学校还会在毕业以后按地区组织一些校友见面活动,鼓励大家多交流沟通,互通有无。第三,学校的实习资源。系里会定期汇总实习招聘资源在校内网站上,每年春季学期会安排一次比较大型的实习招聘会,基本上都是纽约当地的公司提供的实习岗位。学校不强制要求实习,也不会统一分配实习,一切遵从学生的意愿和安排。专业实习需要用到CPT, 项目读书期间国际生可以使用最多两次CPT,每次CPT相当于一门课程,抵三个学分,这也意味着每次修CPT都要交三个学分的学费。但是在校期间可以申请做Teaching Assistant,Research Assistant或者Grader都是有偿的而且不需要额外的CPT。第四,学校附近企业分布情况。纽约分布着很多娱乐行业的公司,比如NBC的总部,Viacom等,这些公司在招实习生的时候默认只接受纽约区域的学生,主要面向纽约大学和哥伦比亚大学,因此地理位置的优势非常明显。当然纽约以及邻近的新泽西还分布着大大小小的tech公司,医药公司等,所提供的实习和就业机会很多。(三)薪资情况关于薪资,根据公司规模、地理位置和工作职能,薪资待遇还是存在较为明显的差异,但一般情况下应届毕业生成为数据科学家之后的薪资在年薪8w-13w不等,随着经验的提高会有所上升。通常公司每年会有2-4次performance review, 如果评分较高的话就会有升职加薪的机会。个人经历分享(一)实习经历当时在第一年暑期去了NBCU的总部做了暑期数据科学家实习生。这份实习是从系里老师在网站上发布的招聘信息里看到的,经过了一轮video 面试,一轮电话面试和一轮案例分析才拿到最终的offer。后来上司提出了让学姐第二年春季继续做实习生的offer,也欣然接受了。在实习过程中,组长和大老板都教会了自己很多,而且组长在我毕业前还提供了工作机会。因此大家在实习期间一定要好好表现,不管有没有return offer,你的同事和领导都会成为你潜在的资源和人脉。(二)求职过程关于找工作的时间线,全职的硕士毕业生一般在5月份毕业,大家基本都会在1月甚至更早开始投简历,找内推,陆续接到面试邀请。毕业前差不多大家都能够拿到offer并在7/8月正式入职。总之一定要尽早开始,多积累面试经验,遇到挫折不气馁。数据科学这个专业基本上只要你想找,还是都能找得到的,只不过每个人的这个求职过程和周期会有所差别。
东方科技论坛青年学者论坛:人工智能海外博士生研讨会 ,汇集了世界顶级高校的高年级博士生,专业覆盖当前人工智能的多个热点领域。会议委员会由顶尖青年学者组成,与会者经委员会精心挑选邀请,大部分是两年内即将毕业的博士在读学生,就读院校均为世界顶尖高校,如卡内基梅隆大学、斯坦福大学、麻省理工学院、加州大学伯克利分校、剑桥大学、纽约大学、华盛顿大学等。会议议程包括: 理论及核心算法 、 自然语言处理 、 计算机视觉 、 游戏及大众智能 、 人 工智能在创意艺术领域的应用 。本次活动由上海纽约大学数据科学研究中心与华院数据发起和承办,上海市人民政府、中国科学院和中国工程院主办,亚马逊云计算实验室协办。活动详情请参考官网: www.ai-flair.org请注意:本次活动对公众开放,但因活动席位有限,将优先接受有邀请码的客人。请点击文末“ 阅读原文 ”进行报名。本次活动也开设 网络直播 ,可扫文末 二维码 观看网络直播。 会议委员会何凯明, Facebook李沐,Amazon吕正东,Deeplycurious.ai田渊栋,Facebook David Wipf,微软研究院夏光宇,上海纽约大学张峥(委员会主席),上海纽约大学 演讲嘉宾陈天奇,华盛顿大学杜少雷,卡内基梅隆大学顾世翔,剑桥大学胡戎航,加州大学伯克利分校胡志挺,卡内基梅隆大学Natsumi Kato,筑波大学孔祥宇,北京大学彭昊,华盛顿大学Ravid Schwartz-Ziv,希伯来大学施正珊,斯坦福大学王敏捷,纽约大学赵俊博,纽约大学张雨倩,哥伦比亚大学周家骥,卡内基梅隆大学朱玉可,斯坦福大学 主讲嘉宾 李航,今日头条实验室主任李航现为今日头条实验室主任,曾任华为诺亚方舟实验室主任;1990-2001年,供职于NEC公司研究实验室;2001-2012年,在微软亚洲研究院工作;其研究领域包括信息检索、自然语言处理、统计机器学习和数据挖掘。 田渊栋,Facebook人工智能实验室研究员田渊栋现为Facebook人工智能实验室研究员;加入Facebook前,曾于2013-2014年担任谷歌X公司自动驾驶车小组的研究员与软件工程师。 David Wipf, 微软研究院首席研究员David Wipf目前是微软研究院位于北京的可视化计算小组首席研究员;其研究兴趣包括非凸优化、贝叶斯推理、稀疏/结构化算法和深度学习。 东方科技论坛青年学者论坛:人工智能海外博士生研讨会 时间: 12月20日-21日 地点: 上海纽约大学1504室 讲座语言: 英文 扫二维码观看网络直播 Scan QR Code to watch livestreaming
大数据文摘作品编译:Fei、杨小咩是小怪兽、张南星、Rita、云舟数据科学为何迷人?这与数据科学家密不可分!通过合理使用大量数据,在这群人的手中,大批新应用、新行业应用而生。语音识别,计算机视觉中的物体识别,机器人,自动驾驶汽车,生物信息学,神经科学,系外行星的发现,对宇宙起源的理解,以及在经费有限的条件下,组织一支胜出的棒球队。数据科学家是整个产业的核心。他们必须将应用领域的知识与统计专业知识结合起来,并运用最新的计算机科学思想来实施。本文节选自《工作中的数据科学家》,书中采访了16个不同行业的16位顶级数据科学家,以了解他们在理论上如何思考,以及在实际中解决什么问题,数据的作用和取得成功的原因。本文中,你将看到这些来自不同行业的科学家对以下这个问题的回答:“你会给初入数据科学行业的人提供什么建议?”去年,大数据文摘也花费3个月的时间,访谈了来自不同国家不同行业的10位顶级数据科学团队负责人。感兴趣的同学可以在文末看到这十篇内容。Chris Wiggins,纽约时报首席数据科学家、哥伦比亚应用数学副教授创造力和关怀。你必须真正喜欢某件事情,愿意花很长一段时间来琢磨它。还有,保持一定的怀疑。我喜欢博士生的一个原因是——五年的时间足以让你有一个发现,让你认识到你一路上做错的所有事情。对你来说很棒的是,能理智地反复思考“冷聚变”然后意识到“哦,我真的搞砸了”,从而犯下一系列错误并解决它们。我认为攻读博士学位的过程,特别是做研究时,确实能让你对那些看起来理所当然的事情有所怀疑。我认为这点很有用,因为,如果不能保持怀疑,你很容易就会走上错误的道路——因为这是你第一次遇到一条看起来很靠谱的路。虽然这个答案看起来无聊,但事实是你需要真正拥有技术深度。数据科学还未形成一个领域,所以目前还没有证据。我们很容易就可以通过维基百科理解机器学习的概念。但要真正做到这一点,你需要知道对一个具体的问题应该使用哪种工具,而且你需要充分了解每种工具的缺陷和限制。要获得这些经验没有捷径。只有不断试错。你会发现自己将分类问题归入聚类问题,或将聚类问题归入假设检验问题。你发现自己开始尝试某些事情,自信自己做的是对的,然而最终意识到你完全错了,这样的事情你会经历许多次,而且非常不幸没有捷径可走——但这会提升你的经验。你只需要这样做下去,并不断犯错误,这也是另一个我喜欢在这个领域从业多年的人的理由。在某件事上要想成为专家需要很长时间。这需要多年的错误。几个世纪以来现实一直如此。引用著名物理学家Niels Bohr的一句名言,成为一个领域的专家的方法就是在该领域中尽可能地犯错。Caitlin Smallwood,Netflix的科学与算法副总裁我会说在你做任何其他事情之前,首先要硬着头皮理解数据的基础知识,尽管它既不迷人也不那么有趣。换句话说,努力了解如何捕获数据,准确理解每个数据字段是如何定义的,并了解数据何时丢失。如果数据缺失,这是否意味着什么?它是否仅在某些情况下丢失?这些小小的微妙的数据陷阱会让你深深陷入数据科学的魅力中。你可以使用最复杂的算法,但如果这一切建立在不经检验的数据集上,你得到的结果也毫无价值。无论你有多迫不及待想要着手数据建模的部分,你都无法忽略原始的数据。在开始建模之前,标记你的i,跨过你的t,仔细检查你所掌握的所有底层数据。我又渐渐学会的另一件事是,在系统环境下,混合算法几乎总比单一算法表现得出色,因为不同的技术会利用数据模式的不同方面,特别是在复杂的大型数据集中。因此,虽然你可以采用一种特定的算法并不断迭代以获得更好的模型,但我的经验是,算法组合往往比单一算法更好。Yann LeCun,Facebook人工智能研究总监、纽约大学教授我总是给出同样的建议,因为我经常被问到这个问题。我认为,如果你是一名本科生,选择一门你可以尽可能多地学习数学和物理课程的专业。而且它必须是正确的课程。我说的话可能听起来自相矛盾了,但工程学或物理学的专业可能比数学、计算机科学或经济学更合适。当然,你需要学习编程,所以你需要参加计算机科学专业的大量课程来学习编程的机制。然后,参与一项数据科学领域的研究生项目。学习本科生的机器学习,人工智能或计算机视觉课程,因为你需要接触这些技术。在那之后,尽可能多地参加数学和物理课程,尤其是应用数学课程,例如优化问题,因为他们使你能够更加充分地应对真正的挑战。这也取决于你想去的地方,因为数据科学或人工智能的背景下有许多不同的工作。人们应该真正思考他们想做什么,然后研究这些主题。目前的热门话题是深度学习,这意味着你需要学习和理解神经网络的经典著作,学习优化问题,学习线性代数等知识。这有助于你了解我们每天会遇到的基本数学技巧和一般概念。Erin Shellman,Zymergen的数据科学经理、Nordstrom数据实验室和AWS S3的前数据科学家对于那些仍在决定学习什么的人来说,我会说STEM(理工科)领域毫无意义,尤其是‘TEM’领域。学习STEM科目将为你提供测试和了解世界的工具。这就是我对数学,统计和机器学习的看法。我对数学本身不感兴趣,但我的兴趣在于用数学来描述事物。毕竟这些都是工具集,所以即使你对数学或统计学上不感兴趣,这仍然非常值得我们投入进去,考虑如何将它应用于你真正热爱的事情上。对于像我这样试图转型的人来说,我会觉得很困难。要知道,转行很困难,而且你必须加倍努力。这不是数据科学独有的困难——这就是生活。在这个领域,我们很难不与别人建立联系,我们可以通过与慷慨的人们见面、喝咖啡来建立有效的联系。在我的生活中,头条规则就是“跟进”。如果你和某个人交流,在他身上发现了你想要的东西,就跟进。数据科学家的文章可能非常唬人,因为大多数文章读起来像数据科学术语表。事实是,技术变化如此之快,以至于没有人拥有可能值得记录下来的所有经验。当你看到这里时,这一点可能是压倒性的,而且你可能会觉得“这不适合我,我没有任何这些技能,也没有什么可以贡献的。”我劝你们不要有这种想法,只要你随时都可以改变和学习新东西。最终,公司需要的是能够严格定义问题并设计解决方案的人。他们也需要善于学习的人。我认为这些才是核心技能。Daniel Tunkelang, Twiggle的首席搜索传道者、LinkedIn的前搜索质量主管对于那些来自数学或自然科学领域的人,我建议他们投资于学习软件技能——尤其是Hadoop和R,它们是使用最广泛的工具。来自软件工程的人应该参加一个机器学习课程,并使用真实的数据进行一个项目,其中许多数据都是免费的。正如许多人所说,成为数据科学家的最好方式是实践数据科学。数据就在那里,科学也不是那么难学,特别是对于那些受过数学、科学或工程学训练的人。读《数据的不合理有效性》—谷歌研究人员Alon Halevy、Peter Norvig和Fernando Pereira的一篇经典文章。文章通常被总结为“更多的数据胜过更好的算法。”数据的不合理有效性:http://www.cs.columbia.e/igert/courses/E6898/Norvig.pdf整篇文章都值得一读,因为它概述了最近在使用网络规模数据改进语音识别和机器翻译方面取得的成功。另外,请听Monica Rogati关于更好的数据如何击败更多数据的见解吧。理解并内化这两个观点,你正在成为一名数据科学家的道路上狂奔。John Foreman,产品管理副总裁兼MailChimp前首席数据科学家我发现很难找到并聘用合适的人。这确实是一件很困难的事情,因为当我们思考大学制度的现状时,无论是本科生还是研究生院,你只关注一件事。你擅长什么。但数据科学家有点像新兴的文艺复兴人士,因为数据科学本质上是多学科的。这就是为什么有了那个“数据科学家比计算机程序员懂得更多的统计知识,并且能比统计学家更好地编程”的一个大笑话的原因。这个笑话是什么意思?这是说数据科学家是一个对这两件事情略知一二的人。但我想说,他们知道的不只是两件事。他们还必须知道如何沟通。他们还需要知道概率,组合,微积分等。学习一些可视化也无妨。他们还需要知道如何操作数据,使用数据库,甚至一点点OR。有很多事情他们需要知道。所以要找到这些人真的很难,因为他们必须接触很多学科,他们必须能够明智地讲述他们的经验。这对任何一个申请人来说都是个艰巨的任务。雇用一个人需要很长时间,这也是为什么我认为人们一直在谈论现在数据科学还没有足够的人才的原因。我认为这在一定程度上是正确的。我想一些正在开办的学位课程会对现状有所帮助。但即使如此,从这些学位项目中毕业,对于MailChimp,我们还是会看看你如何表达并与我们交流这个特定项目是如何教会你使用数据科学横贯多个学科的。这将淘汰非常多的人。我希望有更多的课程将重点着眼于数据科学家在工作环境的沟通和协作方面。Roger Ehrenberg,IA风险投资公司的执行合伙人我想这些领域有最多的机会也有最大的挑战。医疗保健数据显然在PII和隐私问题上有一些大问题。除此之外,还有僵硬的官僚主义,僵化的基础设施和数据孤岛,这使得解决需要跨多个数据集进行集成的难题变得非常困难。但数据一定会改变这个行业,我认为我们在这里讨论的许多技术都直接关系到如何使医疗保健更好、更便宜、更分散。这是一代人的机会。早期的另一个巨大领域是风险管理——不管是金融、贸易还是保险领域。当你在讨论将新的数据集纳入风险评估时,这真的是一个难题——尤其是在将这些技术应用到保险业这样的行业时,就像医疗保健一样,大量官僚机构中存在大量隐私问题和数据。与此同时,这些老旧而僵化的公司才刚刚开始开放,并正在与创业社区互动,以利用新技术。这是另一个让我非常兴奋的领域。第三个我热衷的领域是重塑制造业,并使其更加高效。制造业回归陆上的趋势已经形成。更强大的制造业可能成为在美国创造充满活力的中产阶级的桥梁。我认为技术可以帮助加速这一有利趋势。Claudia Perlich, Dstillery首席科学家我认为,最终,学习如何做数据科学就像学习滑雪。你必须做。你只能看很多视频视频,然后不断地学习。在一天结束的时候,你必须骑上你那该死的雪橇,从那座山上下来。你会在途中崩溃好几次,这很好。这是你需要的学习体验。实际上,我更倾向于问面试者那些不顺利的事情,而不是那些行得通的事情,因为这告诉我他们在这个过程中学到了什么。每当有人来问我,“我应该怎么做?”我说,“是的,当然,参加关于机器学习技术的在线课程。毫无疑问,这是有用的。显然,你必须能够编程,至少在某种程度上。你不必是一名Java程序员,但你必须设法完成一些工作。我不在乎怎样做。”最终,无论是在Datakind花时间做NGO的志愿者,还是去kaggle网站参加他们的一些数据挖掘竞赛——只要去做就好。特别是在Kaggle上,阅读论坛上其他人告诉你的关于这个问题的内容讨论,因为在那里你可以了解到人们在做什么,他们在做什么,以及什么对他们不起作用。因此,任何能让你真正参与到处理数据的事情中去的事情,即使你没有为此得到报酬,也是一件很棒的事情。记住,你必须滑下那座山。没有其他办法了。你无法学习其他方式。所以,自愿抽出时间,用任何你能想到的方式沾手,如果你有机会做实习,那就再好不过了。另外,有很多机会可以让你开始。去做吧。Jonathan Lenaghan, PlaceIQ的首席科学家兼产品开发高级副总裁首先,自我批评是非常重要的:永远质疑你的假设,对你的产出保持偏执。这是最简单的部分。如果人们真的想在数据科学领域取得成功,在技能方面,具备良好的软件工程技能是至关重要的。因此,即使我们雇用的人员很少有编程经验,我们也会非常努力地尽快向他们灌输工程、工程实践和许多优秀的快速编程实践的重要性。这对他们和我们都是有帮助的,因为这些几乎都可以一对一地应用于数据科学。如果你现在查看一下开发程序,它们有连续集成、持续构建、自动化测试和测试工具—所有这些都很好地映射了从开发作业世界到数据操作(我从Red Monk借鉴的短语)世界。我认为这是一个非常强大的概念。对所有数据进行测试非常重要,这样如果你更改了代码,你就可以返回并测试所有数据。拥有工程学思想对于在数据科学领域高速发展至关重要。阅读《完整代码》和《实用主义程序员》会比阅读机器学习的书籍给你带来更多——但是,当然你也必须阅读机器学习的书籍。Anna Smith,Spotify高级数据工程师、Rent the Runway前分析工程师如果有人刚刚开始从事数据科学,那么最重要的事情就是要了解问别人问题是一件很好的事儿。我也认为谦卑是很重要的。你必须确保你没有被束缚在你正在做的事情中。你总是可以做出改变并重新开始。我认为,在你刚起步的时候,能够废弃代码真的很困难,但最重要的事情是做一些事情。即使你没有数据科学方面的工作,您仍然可以在宕机时间内探索数据集,并且可以提出问题来询问数据。在我个人的时间里,我琢磨过Reddit的数据。我问自己,“我可以如何通过我拥有或没有的工具来探索Reddit?”这很好,因为一旦你开始了,你可以看到其他人如何解决同样的问题。用你的直觉,开始阅读别人的文章,然后说,“我可以在我的方法中使用这个技巧。”缓慢的开始,缓慢的前进。当我开始的时候,我尝试了很多阅读,但我认为这并没有什么帮助,直到你真正使用代码和数据来理解它的工作原理,以及它是如何运行的。当人们将其呈现在书本中时,这一切都很美好。在现实生活中,事实并非如此。我认为尝试很多不同的东西也是非常重要的。我从未想过我会在这里。我也不知道五年后我会在哪里。但也许这就是我如何学习的,通过学习一些不同的学科的知识,来尝试理解什么才是最适合我的。Andre Karpistsenko, Taxify数据科学首席及创始人之一、PlanetOS研发负责人虽然这听起来有些大而化之,但我认为你应该相信自己并且遵从内心。如果仅仅只盲从媒体新闻所宣扬的内容,然后选择了自己并不喜欢的方向,我认为你会很容易感到沮丧。所以当我们回到数据科学上时,你应该把它看做职业生涯的起点。数据科学的背景对于未来发展将有极大助力,开发软件以及数据统计的技能将帮助你在任何领域中都能做出更明智的决策。譬如,我们曾多次听说一个运动员是如何通过数据来改善自身表现的:通过改善并反复练习应该起跳的角度,他成为了金牌所有者。这完全可以归功于数据驱动的方法。如果需要我给出更具体的操作性建议,那么需要看这个接受建议者的野心有多大了。如果这个人是想创造新的方法和工具,那么建议将会大不相同,因为这需要在选定的方向上坚持不懈,才会成功。但如果目的仅仅是能够在很多情况下灵活机动,那么一个丰富的工具箱就可以解决你的问题。我曾经得到的最佳建议来自于斯坦福的一个教授,不久之前我上过他的课。他的建议是成为一个T型人才,即在核心竞争力之外能够有次级核心竞争力,如此便能在自己需要或者想要转行的时候有所选择。除了在某一垂直领域拥有专家级别的技能之外,他还建议拥有足够宽的横向背景,以便在不同情况下与不同的人合作。所以如果你还是学生,那么建造一个T型能力树,拥有次级核心技能,这也许你能选择的最佳成长路线了。同时,最重要的事情在于与一帮比自己优秀的人相处,然后从他们身上不断学习。这是我能提供的最好建议。大学校园是你能够深切体会到人之多样性的地方。如果你能够与最优秀的人共同工作,那么你就能在任何事情上获得成功。Amy Heineike,PrimerAI科技副总裁、 Quid前数学首席我认为他们也许需要开始审视内心,分辨自己真正在乎的东西是什么。自己真正想做的事情是什么?当下,数据科学的确算是热点之一,所以也许很多人都认为如果能够给自己贴上“数据科学家”的标签,那么快乐、幸福以及金钱近在咫尺。所以我真心建议分辨一下自己对数据科学的什么内容感兴趣,这是你应该问自己的第一个问题。其次,考虑一下如何让自己精通这个内容,以及这个内容背后所代表的工作是什么,它和你真正感兴趣的内容是否相符。我们的策略是深入挖掘你需要学习的某一块内容。我们团队中有自然语言处理的博士或者物理学博士,他们需要使用很多不同的分析工具。你可以成为某一领域的专家,然后找到同样在试图解决相同问题或者类似问题的人,并学习他们解决问题的方式。这是一种方法。另一个方法就是跳出盒子。世界之大,数据集的多样性超过想象。如果你正在某家公司工作,想看一些新机会,那么想想看你手中是否有一些数据可以通过更加有趣的方式处理。尽量寻找新机会尝试不同的内容,然后看这是否是自己想做的事情。甚至自己在家都可以找到开放的数据集。到处看看,戳戳,说不定就能找打可以“玩弄”的数据。我认为这是一个好起点。以“数据科学”之名义,有许多不同的角色供你选择,同时也存在许多你认为与数据科学相关但尚未被贴上标签的角色,因为人们尚未意识到它们的存在。所以再三思考你真正想要的是什么。Victor Hu,QBE保险数据科学首席、Next Big Sound前数据科学家首先你需要讲一个故事。你每天做的事情是能够真正沉到系统、组织或者行业的本质中去的。但如果你希望自己做的事情对人们是有用且能够理解的,你需要通过讲故事的方式呈现。能够将你所做的事情写出来、讲清楚是非常重要的能力。同时,你也不必太过担心所使用的算法是否足够好。数据的多少和优良都会让算法表现不同,所以如果你能够通过某种渠道获取更多更好、干净且有效的数据——那就太棒啦!Kira Radinsky,eBay数据科学首席科学家及总监、SalesPredict前CTO及创始人之一找到你迫不及待想解决的问题。于我而言,每次当我开始尝试新事物时,如果没有我希望能借之切实解决的问题,那么我会觉得非常无趣。尽快开始阅读一些材料,然后开始着手于你希望解决的问题。随着工作的推进,你会看到自己的问题,这些问题就会引导你求助于别的学习材料,包括书籍、论文或者大牛。所以多花点时间在解决问题以及与人沟通上,然后你就会变成下一个大牛。深刻理解基础知识:了解一些基础的数据结构及计算机科学知识;了解所使用工具的基础及数学原理,而不仅仅是如何使用它们;了解输入、输出以及黑盒中所发生的事情,否则将无法知道应用的最佳时机。当然,这也取决于你正在解决的问题是什么。对于不同的问题,有许多不同的工具可供使用。你需要知道每个工具能解决什么问题,并且深刻理解你正试图解决的问题,才能决定使用哪个工具或技巧。Eric Jonas,UC Berkeley EECS博士后、Salesforce前首席预测科学家他们应该理解概率论的来龙去脉。我现在一旦学到新的知识,我就会把它们映射到概率论中。这个做法非常有利,因为它在我解决任何别的问题时,能够提供令人惊讶的、深刻且丰富的基础理论。E.T. Jaynes所写的Probability Theory: The Logic of Science(《概率论:科学的逻辑》)被我们奉为圣经。在某种意义上,我们认为他的观点很正确。我偏好于使用概率论的方法,因为方法的背后存在两条互相垂直的轴——建模轴以及推理轴。这从根本上反映了我表达问题的方式以及我是如何基于假设使用数据计算出概率的。我最喜欢贝叶斯理论的一点在于我能够在不同的轴上单独进行计算。当然,它们不能够完全独立,但是它们近乎于独立,你就能够充分利用这一点。当我观察诸如深度学习,或者基于LASSO的线性回归系统的算法时,(也就是最近火爆的机器学习理论),它们实际上就是在单独处理一个轴,折叠了另一个轴。当使用基于LASSO的方法时,我会遇到一个问题:“如果我稍微改变一下这个参数,会发生什么?”线性回归模型有非常明显的线性加成高斯模型特征。如果我希望模型以不同的方式呈现,怎么做?突然之间,所有的正则化最小二乘法不顶用了。推理方法并不接受这样的尝试。Jake Porwar, DataKind的创始人及执行总监我认为扎实的统计学背景是前提,因为你需要知道你在做什么,并且充分理解你所建造模型的本质。除此之外,我的统计学项目也教会了我许多伦理相关的内容,而这也是DataKind正在思考解决的问题。人们总是在想着自己的工作成果将被用在何处,你可以选择给别人一个算法,也可以给一个提供拦截建议的模型,警察们也会根据这个模型行动,但是他们行动的理由是什么,结果会如何?这就像在创造新的科学技术,而你在思考算法带来好处的同时,也需要充分考虑其中的风险,因为你要对你所创造的东西负起责任来。无论你的出身好或坏,一旦你充分理解所使用的模型,这就是你能做到的最好的事情。我们现在是科学家,仅仅考虑如何设计好产品是不够的,我们正试图总结所生存世界的规律。这就是统计学的魅力所在——通过统计数据来证明一个假设,或者通过建立一个模型以揭示这个世界是如何运作的。如果只是盲目地相信模型结论,这将非常危险,因为这就是你对这个世界的解释;这个模型有多少缺陷,你对这个世界的理解就有多少缺陷。简而言之,学习统计学,增加自己的洞察力。《数据科学家在路上》这篇文章给我们介绍了顶尖的数据科学家是如何在令人眼花缭乱的行业和应用间工作的——每个人都充分利用了自身对不同领域的理解,以及统计学、计算机科学知识来创造不可估量的财富及影响力。数据增长的速度越来越快,对于能够充分理解数据、并从中提取价值的人需求也越来越大。如果你想继承数据科学家的衣钵,那么这些优秀数据科学实践者们所说的内容,将成为来之不易的建议,并且将激发你对数据和模型的激情。
作者 | 陈彩娴、陈大鑫编辑 | 陈大鑫10月8日,谷歌发布2020年博士生奖研金名单(2020 Google PhD Fellows),大陆高校在读博士无一人入选,但海外高校在读博士生入选中,大陆学子有12人!根据2020年谷歌博士生奖研金项目名单显示,一共有53位博士生入选,其中机器学习16人,机器感知/语音技术/计算机视觉10人,自然语言处理4人,系统与网络4人,隐私与安全3人,移动计算1人。获奖的12名大陆学子本科均就读于大陆知名高校,如中科大少年班、上交大ACM班、浙大、北航、哈工大、电子科技大学等等。有人曾在AI顶会发表7篇一作,有人大厂实习经验丰富,有人每年获国家奖学金……1关于谷歌奖研金谷歌的博士生奖研金项目(Google Ph.D Fellowship Program)创立于 2009 年,以奖励在计算机学科及其相关学科或者其它前瞻科研领域方面表现优异的博士生。自创立以来,该项目已经资助来自澳大利亚、中国和东亚、印度、北美、欧洲、中东和非洲的近 500 名学生。“We have given these students unique fellowships to acknowledge their contributions to their areas of specialty and provide funding for their ecation and research. We look forward to working closely with them as they continue to become leaders in their respective fields.” — Google.每年,谷歌 PhD Fellows 都会被邀请参加全球PhD Fellowship Summit,在那里他们可以接触到谷歌正在进行的最先进的研究,并有机会与谷歌的研究员以及来自世界各地的其他博士研究生交流。2018年 PhD Fellowship Summit入选博士生合照2019年 PhD Fellowship Summit入选博士生合照2入选大陆学子机器学习领域:白磊,新南威尔士大学个人主页:http://lei.site/白磊于2010年考入西安电子科技大学就读本科,硕士留校继续深造,2017年硕士毕业后赴澳留学,目前就读于澳大利亚新南威尔士大学,师从姚丽娜副教授与Salil Kanhere教授。他的主要研究方向为多模式顺序数据中的模式发现和知识挖掘开发鲁棒且通用的时空学习算法,曾在NeurIPS、IJCAI等顶会发表论文13篇、期刊论文1篇。陈心诗,佐治亚理工学院个人主页:http://xinshi-chen.com/陈心诗本科与硕士就读于香港中文大学数学专业,曾在橡树岭国家实验室、蚂蚁金服和Facebook AI等知名机构担任过研究实习生,目前在佐治亚理工学院攻读博士。主要研究方向:数据驱动算法设计、概率图形模型与结构化数据的深度学习的交集。曾在NeurIPS、ICML、ICLR等等顶会与期刊上发表论文8篇,其中一作5篇。罗雅丹, 昆士兰大学个人主页:https://sites.google.com/view/yadanluo/home罗雅丹本科就读于电子科技大学英才实验学院,2013年至2015年均获国家奖学金,期间曾在台湾交通大学和加利福尼亚大学河滨分校做过交换生,曾在大疆进行了为期半年的深度学习实习。在电子科技大学【英才记忆】栏目下,罗雅丹谈到自己在大二时开始对码代码产生兴趣,“一头扎进了BMCC 学编程、学caffe,感觉不累。”在美国交换期间,她发现自己对CV的了解并不深入,当时有感而发,写下:“一个博士对自己方向的基础拎不清是不合格的。”本科毕业Gap一段时间之后她继续投入研究,目前在澳洲昆士兰大学信息技术与电气工程学院攻读博士学位。曾发表期刊论文5篇(IEEE Trans.3篇),在AAAI、IJCAI、ICML、TNNLS等顶会发表论文11篇,研究成果入选ACM Multimeida 2019。机器感知,语音技术,计算机视觉:吴楠, 纽约大学个人主页:https://wooginawunan.github.io/吴楠于2012年从邯郸一中考入中科大少年班,2016年获统计学和工商管理双学位。目前,她在纽约大学数据科学中心攻读博士,其所在团队主要从事深度学习与医学影像的研究,集中在与乳腺癌筛查有关的应用和理论学习问题上。吴楠主要专注于在涉及多种输入方式时提高深度神经网络的性能。他们团队的工作《Deep Neural Networks Improve Radiologists' Performance in Breast Cancer Screening》获得了ICML 2019"AI for good social work"最佳论文,其中吴楠担任一作。史少帅, 香港中文大学个人主页:https://shishaoshuai.com/Shaoshuai Shi本科就读于哈尔滨工业大学CS专业,从大二到大四连续获一等奖奖学金,大三期间曾在微软亚洲研究院实习,2017年毕业后赴港学习,目前是香港中文大学多媒体实验室(MMLab)的一名博士生,师从王晓刚与李鸿升。他的研究方向主要是计算机视觉和深度学习,尤其是自动驾驶场景下的3D场景理解和对象检测。曾在ECCV、ICLR、CVPR、ICRA等顶会上发表多篇论文。Yifan Liu, 阿德莱德大学个人主页:https://irfanicmll.github.io/Yifan Liu本科与硕士就读于北京航天航空大学自动化科学与电气工程学院,师从秦曾昌教授。年赴澳留学,目前在澳大利亚阿德莱德大学攻读CS博士,导师为Chunhua Shen。曾在CVPR、ICCV、ECCV等顶会上发表论文,目前共发表11篇论文,其中一作5篇。武宇,悉尼科技大学个人主页:https://yu-wu.net/武宇2015年本科毕业于上海交通大学机械工程学院,2017年7月赴澳留学,目前是悉尼科技大学ReLER实验室的三年级博士生。曾在ECCV、CVPR、AAAI、ICCV等会议上发表多篇论文,共发表18篇论文,并曾担任CVPR,ICCV,ECCV,NIPS,AAAI,ACM MM,WACV,ACCV,TPAMI,TIP,TNNLS,TCSVT,PR等期刊会议的审稿人。移动计算Xiaofan Zhang, 伊利诺伊大学厄巴纳-香槟分校个人主页:https://zhangxf218.wixsite.com/mysiteXiaofan Zhang本科与硕士就读于电子科技大学,2016年硕士毕业后赴伊利诺伊大学厄巴纳-香槟分校攻读博士,导师为Deming Chen教授。研究方向为:深度学习、软硬件协同设计与节能计算,目前专注研究用于深度学习算法的基于FPGA的加速器设计。目前在IEEE、CVPR、ICCAD等会议上已发表27篇论文,其中一作9篇。此外,他曾在2013年获本科优秀毕业论文,硕士三年期间均获一等奖学金,2018年获ICCAD最佳论文奖。自然语言处理:Mingda Chen, 丰田工业大学芝加哥分校个人主页:https://ttic.uchicago.e/~mchen/Mingda Chen本科就读于浙江大学数学科学学院,目前是芝加哥丰田技术学院(TTIC)的博士四年级学生,主要研究兴趣为机器学习和自然语言处理,重点研究用于NLP的神经潜变量模型,以及使用自然发生的监督进行可扩展的语言预训练。他目前已在ACL、ICLR、AAAI、EMNLP等顶会上发表论文共9篇,其中一作7篇,所在团队的论文《ALBERT: A Lite BERT for Self-supervised Learning of Language Representations》被接收为2020年ICLR Spotlight。隐私与安全:邓舒文,耶鲁大学个人主页:https://csl.yale.e/~shuwen/index.html邓舒文本科就读于上海交通大学电子信息与电气工程学院,曾获得国家奖学金、美国大学生数学建模竞赛奖项一等奖。2016年毕业后赴耶鲁大学攻读电子工程博士,2019年作为访问学者赴普林斯顿大学,参与由资深安全研究员Ruby Lee领导的PALMS实验室工作,曾在英特尔实习4个月。目前研究计算机体系结构,硬件安全,在ISCA、JHSS、HASP、ASPLOS等发表过7篇论文,其中一作5篇。结构化数据与数据库管理:Yanqing Peng,犹他大学个人主页:https://www.cs.utah.e/~ypeng/Yanqing Peng本科就读于上海交通大学ACM班计算机科学专业。2016年本科毕业后,赴美国犹他大学攻读CS博士生,导师为李飞飞(男)。研究领域为系统ML、SGX安全和区块链。目前共发表9篇论文,其中一作两篇,李飞飞参与并指导的论文有5篇。曾在微软亚洲研究院、微软研究、阿里巴巴美国等机构实习。系统与网络:刘思航,弗吉尼亚大学夏洛茨维尔分校个人主页:https://www.sihangliu.com/刘思航本科参与上海交通大学与密歇根大学的“2+2”项目学习,目前在弗吉尼亚大学夏洛茨维尔分校就读CS博士四年级,主要研究方向为计算机体系结构和操作系统。他在ASPLOS、ISCA等计算机体系架构顶会上发表过8篇论文,其中一作6篇。获奖名单地址:https://ai.googleblog.com/2020/10/announcing-2020-google-phd-fellows.htmlNeurIPS 2020论文接收列表已出,欢迎大家投稿让更多的人了解你们的工作~
最近这两年随着大数据和互联网的发展,数据科学专业也热起来了。最近来咨询美国数据科学(DS)留学申请/美国商业分析(BA)留学申请的同学是最多的。为了帮助更多关注美国数据科学专业选校定位的同学,我推荐一个简易的定校表格,大家可以做个参考,如果是需要一对一咨询留学问题,可以联系时代兴华留学,我会给大家详细介绍。美国研究生申请条件参考华盛顿大学西雅图-美国数据科学(DS)留学Master of Science in Data Science华盛顿大学西雅图(University of Washington)提供数据科学方面的顶级硕士学位。它的特点是综合性,跨学科的课程。该专业是与以下不用学院学系合作开发的:应用数学系生物统计学系计算机科学与工程系设计与工程系统计系信息学院课程安排在晚上,全日制学生每周有两个晚上在UW西雅图校区上课。该项目包括九门核心课程和一个Capstone项目。毕业生将专注于的专业领域如:统计建模机器学习软件工程数据管理#29 -Stanford University斯坦福大学-美国数据科学(DS)留学M.S. in Statistics: Data Science斯坦福大学(Stanford University)数据科学专业的顶级硕士学位是与统计学系和计算与数学工程研究所(ICME)合作授予的。通过以下课程,学生接受以计算为重点的数据科学训练:数学统计数据编程数据科学没有论文要求,学生可以继续准备高级博士学习。专业选修课的范围如下:机器学习挖掘海量数据集数据驱动的医学来自大数据的商业智能#28 -Georgetown University乔治城大学-美国数据科学(DS)留学Master of Science in Analytics-Data Science乔治城大学(Georgetown University)的顶级分析硕士学位是通过与计算机科学系和数学与统计系的合作而授予的。这个严谨的项目为学生提供数学、计算和统计方法方面的培训。该项目面向应届毕业生和寻求晋升或新职业的专业人士。全日制学生只需两年就能拿到学位(转学学分或暑期课程更少)。课程通常在下午晚些时候或晚上提供,以适应职业人士。学生有机会参与独特的活动,如数据可视化挑战,德勤核心咨询系列和分析学生展示。#27 -Southern Methodist University南卫理工大学-美国数据科学(DS)留学Applied MS in Statistics and Data Analytics Program (MASDA)位于德克萨斯州达拉斯市的南卫理公会大学(Southern MethodistUniversity)的统计与数据分析应用硕士(Applied MS in Statistics andData Analytics)项目旨在培养学生具备强大的统计基础和分析能力,以解决复杂的问题。学生只需18-24个月就能完成学业。统计及数据分析应用硕士课程的重点如下:流行病学统计方法时间序列分析数据库管理统计计算计算统计数据学院师资力量雄厚,数据分析经验丰富。学生发展统计计算能力的SAS和R,许多能够通过SAS认证考试。通过统计咨询服务中心提供咨询实习经验,让学生有机会与实际客户合作。#26 -University of San Francisco旧金山大学-美国数据科学(DS)留学MS in Data Science旧金山大学艺术与科学学院(College of Arts and Sciencesat The University of San Francisco)的数据科学专业的顶尖硕士学位只需要12个月就能完成。这个严格的项目使用了最先进的开放源码课程,为学生发展所需的技能,以成功在世界上增长最快的领域之一。课程主题包括:机器学习回归网页抓取SQL和NoSQL数据库管理聚类分析这个35学时的项目有一个夏季分析训练营,旨在帮助学生学习或温习数据科学家工作所需的技能。实习项目允许学生在该领域兼职,以获得为期九个月的专业工作经验。学生在平日上课,并预留两天进行实习工作。#25 -The University of Texas at Austin德克萨斯大学奥斯汀分校-美国数据科学(DS)留学Master of Science in Business Analytics德克萨斯大学奥斯汀分校(Universityof Texas Austin)的麦库姆斯商学院(McCombsSchool of Business)开设了一个顶级的商业分析硕士课程,只需10个月就能完成。学生们受益于独特的网络机会和行业联系,而这在其他数据科学项目中并不常见。课程涵盖了供应链分析、文本分析、决策分析和数据分析编程等领域。学生们与职业发展团队一起工作,帮助他们确保毕业后获得成功。#24 -University of Colorado科罗拉多大学-美国数据科学(DS)留学MS in Computer Science with emphasis in Data Science & Engineering科罗拉多大学拥有数据科学创新顶尖硕士学位,提供广泛的雇主在尝试和理解大数据时需要的知识。该计划既可在线上也可在校内使用,课程由经验丰富的教师授课。课程涵盖数据系统的设计和分析,数据中心规模计算,数据挖掘和机器学习等领域。#23 -Arizona State University亚利桑那州立大学-美国数据科学(DS)留学Master of Science in Business Analytics凯里商学院商业分析理学硕士课程为期九个月,包括10门数据和分析课程。这是一个很好的项目,为刚毕业的学生与强大的数量背景。该项目每年8月开始,课程在网上或工作日在校园里提供。全日制学生只需九个月的学习就能获得学位。这是一个指定的STEM项目,所以国际学生有资格在毕业后在美国从事长达36个月的全职工作。根据《美国新闻与世界报道》(U.S. News and World Report) 2019年的一份报告,亚利桑那州立大学(Arizona State University)的W·P·凯里商学院(W. P. Carey School of Business) 被认为是最好的商学院和信息系统研究生院之一。#22 -University of Central Florida中佛罗里达大学-美国数据科学(DS)留学Master of Science in Data Analytics (Big Data)中佛罗里达大学拥有30学分的跨学科硕士学位数据分析工程与计算机科学学院和科学学院。学生可以在16-20个月内完成学位。教学是面对面的形式,课程在晚上和周末提供。学生在一个队列中完成该计划,从而获得强大的同伴支持和互动。课程在晚上或周末提供,以满足工作专业人士的需求。这个顶级数据科学硕士课程的课程包括:并行和云计算网络科学机器学习并行和分布式数据库系统数据挖掘统计分析#21 -University of Oklahoma–Norman俄克拉荷马大学-美国数据科学(DS)留学Master’s in Data Science and Analytics俄克拉荷马大学拥有与计算机科学与工业与系统工程学院共同提供的数据科学与分析计划的顶级硕士学位。全日制学生只需14个月即可获得学位。无法承担全日制课程的学生也可以获得兼职机会。课程在线提供,校园提供,或两者兼而有之。所有核心课程完成后,为学生提供实习经验。核心课程包括计算结构,算法分析,智能数据分析和工程统计分析。对于计划继续攻读博士学位的学生,可以选择论文选项。#20-Oklahoma State University–Stillwater俄克拉荷马州立大学-美国数据科学(DS)留学M.S. in Business Analytics (MSBAN)俄克拉荷马州立大学斯皮尔斯商学院(SpearsSchool of business at Oklahoma State University)提供的顶级商业分析硕士(The topmaster’s in business analytics)课程是一个为期四个学期的在线和校内课程。该项目极具竞争力,每年平均录取率为21%。数据科学硕士已获得STEM分类。这使得国际学生可以在美国额外获得17个月的可选实践培训:分析机器学习统计数据这个顶尖的数据科学硕士学位也为学生提供了在各种会议上发表和发表研究论文的机会。#19-Kennesaw State University肯尼索州立大学-美国数据科学(DS)留学Master of Science in Applied Statistics (MSAS)肯尼索州立大学(KennesawState University)提供应用统计学硕士学位,旨在帮助学生学习分析真实世界的数据,以开发数据驱动的解决方案。这个36学时的课程有别于大多数传统的统计学硕士课程。它利用SAS和JMP等统计程序分析数据,并在第一学期开始创建摘要。然后,学生们用他们工作或实习中的真实数据完成一个应用项目,以展示他们的技能和知识。该项目的重点是以清晰和简洁的方式将结果传达给不同层次的利益相关者。学生在第二学年也有独特的机会获得他们的六西格玛黑带,以增加毕业后的就业机会。#18 -Seattle University西雅图大学-美国数据科学(DS)留学Master of Science in Business Analytics西雅图大学开发了业务分析计划的顶级硕士学位,以满足对合格商业数据和情报分析师不断增长的需求。SU位于全国发展最快的科技中心之一,地理位置便利,能够与该国一些最具创造性和新兴业务合作。课程涵盖以下领域:数据争夺,可视化和通信决策的数学模型大数据分析新生每年秋季开始学习该课程,每年对申请进行两次复习。该计划由高级商学院协会认可。#17 -University of Virginia弗吉尼亚大学-美国数据科学(DS)留学Master of Science in Data Science (MSDS)弗吉尼亚大学数据科学研究所提供顶级数据科学硕士学位课程。它可以在短短11个月内完成。该计划每年7月开始,并在接下来的5月结束。课程由来自各个领域的教师讲授,包括:计算机科学统计系统和信息工程学生作为一个队列进行整个计划,完成并遵循一个专注于实践学习的综合课程。在课程结束时,学生将完成一项关注数据科学挑战的顶点体验,以获得真实的体验。学生在他们的顶点体验期间接受教师的指导和指导。该计划为MSDS毕业生提供100%的就业率。#16 -University of Chicago芝加哥大学-美国数据科学(DS)留学Master of Science in Analytics (MScA)芝加哥大学格雷厄姆学校的分析科学硕士课程欢迎来自世界各地的学生成为分析领域。课程涵盖以下领域:机器学习和预测分析贝叶斯方法时间序列分析和预测学生可以获得兼职或全日制学位,全日制学生只需五个季度即可完成学位。毕业生将具备在该领域取得成功所需的数据工程和软件技能的高级熟练程度。#15 -Brown University布朗大学Master’s Program in Data Science布朗大学数据科学专业的高级硕士课程由四个学术部门合作提供。该计划可在短短12个月内完成。课程涵盖以下领域:作为数据工程数据和社会统计学习机器学习数据实习允许学生在行业或学术界中处理现实世界的数据项目。学生会接触到影响数据科学领域的道德和社会因素。新生将于9月份开始这项计划。#14 -Northwestern University西北大学-美国数据科学(DS)留学Master of Science in Analytics Program (MSiA)美国西北大学麦考密克工程学院(McCormickSchool of Engineering at Northwestern University)提供分析学硕士学位。它将数学和统计研究与先进的It和数据管理相结合。学生们完成了为期8个月的实习项目、为期3个月的暑期实习和为期10周的顶石设计项目,为就业做好了准备。该项目采用队列模式,每个队列约有40名学生。学生全日制在校学习,预计15个月后就能拿到学位。数据科学硕士课程由以下学院教师讲授:麦考密克工程学院凯洛格管理学院麦迪尔新闻、媒体和综合营销传播学院#13 -Boston University波士顿大学-美国数据科学(DS)留学Master of Science in Computer Information Systems concentration in Data Analytics位于波士顿大学计算机信息系统硕士学位,是该领域的领导者独联体和创新。数据分析硕士课程让学生了解各种主题,包括:数据挖掘文本挖掘,网络挖掘这个40学分的课程包括核心课程和集中课程:概率和统计网站分析和挖掘用R进行数据分析和可视化该计划以在线和传统形式提供,足够灵活,适合专业人士。#12-Massachusetts Institute of Technology麻省理工大学-美国数据科学(DS)留学Master of Business Analytics麻省理工学院斯隆管理学院是世界顶级管理学院之一。麻省理工学院的网络遍布90个不同的国家,拥有超过136,000名校友,网络庞大且令人印象深刻。这是一年专业的商业分析硕士。它专为最近的大学毕业生或希望使用尖端数据科学解决业务挑战的现有学生而设计。课程涵盖以下领域:数据沟通R,Python,SQL和Julia中的分析软件工具机器学习麻省理工学院为那些计划继续超过硕士学位的人提供博士学位的额外数据科学机会。#11-University of Southern California南加州大学-美国数据科学(DS)留学Master of Science in Computer Science (Data Science)南加州大学维特比计算机科学系提供顶级的数据科学硕士学位,为学生在以下领域工作做好准备:能源环境健康医药运输计算机科学系拥有来自信息科学研究所和创新技术研究所的40多名教员。32学时计划结合了数据系统和数据分析两方面的课程。包括一些独特的选修课,例如:信息可视化构建知识图优化理论与技术#10 -DePaul University德保罗大学-美国数据科学(DS)留学MS in Data Science德保罗大学有着提供高质量课程的悠久传统。它的数据科学硕士课程也不例外。学生可以从四个不同的集中领域进行选择,包括:计算方法卫生保健市场营销热情好客学生可以进入数据科学中心和德保罗分析学生小组。这个顶级数据科学硕士项目的学生通过与行业和非营利组织的合作来处理现实世界的分析问题。基础课程的范围包括:Python编程先进的数据分析web数据挖掘先进的机器学习此外,学院亦提供广泛的选修课程,以进一步调整学位#9 -Georgia Institute of Technology佐治亚理工大学-美国数据科学(DS)留学Master of Science in Analytics佐治亚理工学院是一个很受尊敬的学校,它出现在我们的数据科学项目的顶级硕士名单中并不令人惊讶。《美国新闻与世界报道》对佐治亚理工学院进行了排名:研究生课程商业和定量分析统计和运筹学计算机科学佐治亚理工学院提供校内和在线跨学科分析硕士学位。在校学习一年就可以完成。学生可以从以下几个项目中进行选择:分析工具业务分析计算数据分析以队列形式提供的课程,学生们一起完成几门课程,然后扩展到他们的专业领域。#8-North Carolina State University北卡罗来纳州立大学-美国数据科学(DS)留学Master of Science in Analytics北卡罗来纳州立大学高级分析研究所被认为是首要机构之一根据哈佛商业评论,数据科学。这个为期10个月的队列分析师为学生提供团队合作和个性化辅导。课程将定期进行审核,以反映不断变化的业务需求。在毕业生就业能力方面,NCSU毕业时的就业率几乎接近完美,而且近期毕业生的平均基本起薪超过98,000美元/年。#7 -University of Iowa爱荷华大学-美国数据科学(DS)留学Full-time Master of Business Analytics爱荷华大学蒂皮商学院提供三个学期的全部 -时间掌握在业务分析中。学生通过分析咨询顶点课程和实习经验,应用课堂学习来解决实际的业务问题。这个数据科学硕士课程的课程涵盖以下领域:数据和决定数据管理和可视化分析高级分析R中的数据编程数据科学#6 -Colorado State University科罗拉多州立大学-美国数据科学(DS)留学Master of Science in Applied Statistics (MSAS)科罗拉多州立大学应用统计学硕士课程设计作为学生可以在一年内完成的全日制课程。课程由经验丰富的科罗拉多州立大学统计学院教授,可在线获取。学生将学习高级统计程序以增强:市场调查产品开发质量控制这位数据科学计划的顶级硕士课程以实践咨询技术结束,旨在帮助学生利用他们与现实世界客户的沟通和统计技能。课程包括:商业视觉应用开发机器学习的应用定量推理回归模型和应用#5 -Columbia University哥伦比亚大学-美国数据科学(DS)留学Master of Science in Data Science哥伦比亚大学数据科学研究所提供数据科学硕士课程。该计划建立在通过数据科学专业成就认证计划提供的课程基础之上。学生们参与研究,包括最终的顶点项目。该计划可以由全日制和非全日制学生完成,全日制学生只需三个学期即可获得学位。课程涵盖以下领域:概率和统计数据科学算法统计推断和建模机器学习数据科学集中区域包括但不限于:创业数据驱动科学的计算系统数据,媒体和社会健康分析财务和业务分析#4 -Carnegie Mellon University卡内基梅隆大学-美国数据科学(DS)留学Master of Computational Data Science卡耐基梅隆大学(Carnegie MellonUniversity)数据科学的顶级硕士学位位于语言技术研究所(LanguageTechnologies Institute)。课程由计算机科学学院的教师讲授。通过计算数据科学硕士课程,学生可以深入了解:云计算机器学习交互式数据科学学生既要完成行业实习经历,又要完成有助于发展该领域知识和经验的顶石项目。学生根据自己的专业兴趣和工作经验,选择数据科学硕士课程的三个专业之一。浓度为:系统分析以人为中心的数据科学希望寻求研究机会的学生可以直接申请与教员一起工作。#3-New York University纽约大学-美国数据科学(DS)留学MS in Data Science纽约大学的数据科学顶级硕士课程是专为在数学、计算机科学和应用统计学领域有突出表现的学生设计的两年制高选择性课程。该计划的一个关键特点是顶石项目。学生将使用他们的知识和技能来开发和实现一个解决方案来解决一个现实世界的问题。学生可以全日制或非全日制攻读数据科学方面的顶级认证硕士学位。然而,他们必须完成至少24学分的住院实习。专业可用于:数据科学数据科学大数据数据科学、数学和数据数据科学自然语言处理数据科学物理学数据科学生物学#2 -University of Rochester罗彻斯特大学-美国数据科学(DS)留学Master of Science in Data Science罗彻斯特大学戈根数据科学研究所是美国最好的数据科学硕士项目之一。全日制学生只需两三个学期的全日制学习就能完成。许多学生在学期之间获得实习机会,以获得额外的专业经验。未来的学生应该有编程经验,可以来自不同的背景,包括科学、工程、数学和商业。开设细分研究方向有:计算及统计方法健康及生物医学商业及社会科学新生每年秋天入学。课程在白天提供,需要亲自出席。#1 -Pure University普渡大学-美国数据科学(DS)留学Master of Science in Business Analytics and Information Management我们的顶级商业分析和信息管理硕士课程由普渡大学Krannert管理学院提供。这是一个为期11个月的全日制项目。它的目的是教授学生最先进的信息技术,分析技术和软件工具在行业中使用。课程范围包括:六西格玛和质量管理大数据技术优化建模和电子表格这个STEM认证项目不需要以前的工作经验来申请,尽管它确实加强了申请。招生决定每年进行一次,每年夏天开学。
广问AI新闻社讯3月27日,计算机领域最高奖项“图灵奖”迎来了新一届得主——约书亚·本希奥(Yoshua Bengio)、杰弗里·欣顿(Geoffrey Hinton)和杨立昆(Yann LeCun)。两三位科学家同时获奖很少见图灵奖(ACM A.M.Turing Award)由美国计算机协会于1966年设立,专门奖励对计算机事业作出重要贡献的个人,有着“计算领域的诺贝尔奖”(Nobel Prize of Computing)的美誉。其名称源自计算机科学先驱、英国科学家、曼彻斯特大学教授艾伦·图灵(A.M.Turing),奖金高达100万美元,由谷歌公司提供赞助。图灵奖大部分情况下只颁给一位获奖人,两位或三位科学家同时获奖的情况较为少见。三得主均被称为“当代人工智能教父”这三位被业内人士称为“当代人工智能教父”的科学家是深度神经网络(deep neural network)的开创者,这项技术目前已成为计算科学的关键部分,为深度学习(deep learning)算法的发展和应用奠定了基础。约书亚·本希奥(Yoshua Bengio),在加拿大麦吉尔大学取得计算机博士学位。现为加拿大蒙特利尔大学教授、加拿大数据定价中心主任(IVADO)、蒙特利尔学习算法研究中心(Mila)科学主任、加拿大先进研究院主任。他还与杨立昆一起担任加拿大先进研究院机器与大脑学习项目的主管。他创建了目前世界上最大的深度学习研究中心——蒙特利尔学习算法研究中心,使蒙特利尔成为世界上人工智能研究最为活跃的地区之一,引来大批公司和研究室入驻。杰弗里·欣顿(Geoffery Hinton),在爱丁堡大学获得人工智能博士学位。现任谷歌公司副总裁、工程研究员,多伦多人工智能矢量研究所首席科学顾问、多伦多大学名誉教授。他是加拿大先进研究院神经计算和自适应项目(Neural Computation and Adaptive Perception Program)的创始人,还获得了加拿大最高荣誉勋章(Companion of the Order of Canada)、英国皇家学会成员、美国工程院外籍院士、人工智能国际联合会(IJCAI)杰出研究奖等一系列荣誉。2017年被彭博社(Bloomberg)评为改变全球商业格局的50人之一。杨立昆(Yann LeCun),在法国皮埃尔和玛丽·居里大学获得计算机科学博士学位。现任纽约大学柯朗数学科学研究所Silver冠名教授、Facebook公司人工智能首席科学家、副总裁。他获得了包括美国工程院院士、IEEE神经网络先锋奖(IEEE Neural Network Pioneer Award)等一系列荣誉。他还是纽约大学数据科学中心的创始人,与约书亚·本希奥一起担任加拿大先进研究院机器与大脑学习项目的主管。●新闻附件深度学习:人工智能的复兴2018图灵奖得主 约书亚·本希奥/撰文广问AI新闻社/摘编上个世纪50年代,计算机在西洋跳棋(checkers)上击败了人类,还可以解决代数题,引起了巨大轰动。60年代时,人们充满信心地认为科学家很快就可以通过硬件和软件用计算机模拟人脑。到2005年前后,科学界几乎已没人看好机器可以达到人类的智能水平。那个时候,“人工智能”似乎已变成科幻的代名词。从2005年开始,人工智能的形式出现了巨大变革。这一切源于“深度学习”(deep learning)技术的出现,这一方法原本指的是从脑科学中汲取灵感以制造智能机器,但后来已经自成体系。深度学习指的是用计算机模拟神经元网络,以此逐渐“学会”各种任务的过程,比如识别图像、理解语音甚或是自己做决策。这项技术的基础是“人工神经网络”,它是现代人工智能的核心元素。经过训练后的人工神经网络可以完成很多任务,比如识别照片中的人物和物体,或是在几种主要语言之间互相翻译等。深度学习技术彻底改变了人工智能研究的面貌。2011年,首个语音识别产品面世。不久,用于识别图像内容的应用也成熟了起来,该功能现已被整合进了Google Photos的图片搜索引擎。人工智能软件如今已成为数百万智能手机的标配。利用深度学习解决各种问题的过程中,科学家们取得了惊人的成就。2016年3月,神经网络模型AlphaGo击败了世界顶级围棋选手李世石的新闻占据了各大媒体的首页。最新的深度学习算法可从磁共振图像中准确检测出心脏是否衰竭,准确度甚至能和心脏病专家媲美。深度学习属于人工智能领域内一个更宽泛的概念——机器学习,即根据某些基本原理训练一个智能计算系统,最终使机器具备自学的能力。在让电脑学会自学之前,计算机科学家必须搞清楚一些基本问题,比如人类是如何获取知识的?人类的知识部分是天生的,但大部分是从经验中学习而来。上世纪50年代以来,科学家就一直在寻找动物和人类(或机器)从经验中学习知识的基本原理。科学家以大脑为模仿对象,开发出了人工神经网络。受脑科学的启发,计算机科学家开发出了人工神经网络,用软件或硬件实现了虚拟神经元。计算机科学家认为,神经网络可以接收视觉或听觉输入,渐渐改变神经元之间的连接强度,最终网络连接会形成一种特定模式,让神经元的电信号可以提取出图像内容或是对话短语的特征,从而实现一些复杂的任务。深度学习技术的成功依赖于两个关键因素。首先是计算速度的大幅提升:科学家借用了本为电子游戏所设计的图形处理器(GPU),使计算速度提升了10倍,这使在有限的时间内训练大规模网络变为可能。让深度学习研究开展得如火如荼的第二个因素是海量带标记数据集的出现,这些数据集内的所有样例都配有正确的标记。回顾人工智能的历史,我们必须意识到,哪怕一些好的想法受到当时的技术状态限制而看似前景渺茫,我们也不应放弃。
恭喜Elite Cataphract学子斩获Offer!New York University - Master's in Data Science纽约大学 - 数据科学汇报申请背景↓↓↓Elite Cataphract学子:W同学本科学校与专业:双非, 金融+数学申请条件:GPA 3.5+, TOEFL 110+, GRE 320+, 2年全职工作经历录取:New York University - Master's in Data ScienceBlaze trails and break paths.
新智元报道 来源:timdettmers.com作者:Tim Dettmers 编辑:木青【新智元导读】又到一年申请季。随着AI大热,计算机科学博士申请的竞争也变得激烈。如何选择学校?需要发多少论文?导师怎么选?GPA不够高怎么办……斩获CMU、斯坦福大学等名校博士offer的大神写出了史上最全分享帖,你在申请计算机科学博士时遇到的所有问题,这里都有答案。先简单秀一下手里的offer:我获得了斯坦福大学,华盛顿大学,伦敦大学学院,CMU和纽约大学的录取通知。收获是不是还算不错?我深入研究了我是如何在博士申请中取得成功的,于是写下这篇博客文章,和大家讨论,在博士申请中什么才是重要的,而什么又不是;我们应该如何选择和使用申请材料。这篇博客主要针对关注深度学习的博士应用以及自然语言处理,计算机视觉,强化学习和深度学习等相关领域的学生。我目前先假定你已经拥有相对竞争较强的个人资料,也就说你可能已经拥有一个或多个出版论文或刊物,并且你也已经与多人合作进行过研究。写这篇文章的目的是为了提高你申请成功的几率。如果你寻求更多关于博士入学的信息,我建议你先阅读以下这些资料:Academia StackExchange所有最高投票的问题和答案:https://academia.stackexchange.com/questions?sort=votes计算机科学专业博士完整录取过程,这是一位CMU老师写的:http://www.cs.cmu.e/~harchol/gradschooltalk.pdf博客文章《反思计算机科学专业招生》,这适合那些优秀但综合实力并没有那么拔尖的学生:https://da-data.blogspot.com/2015/03/reflecting-on-cs-graate-admissions.html。《如何写出一篇错误的计算机科学博士申请陈述》,反面教材可以用来参考:http://www.cs.cmu.e/~pavlo/blog/2015/10/how-to-write-a-bad-statement-for-a-computer-science-phd-admissions-application.html在接下来的文章中,我会:先定义一下申请过程中哪些是重要的影响因素;然后我们将深入研究申请材料以及如何思考这些问题;再来我将谈谈申请流程全文最主要的部分也是最后一部分将是选择学校:哪些学校对我来说门槛太高或哪些又不是那么值得你去?什么才能被称作是强大的博士申请背景?决定任何研究型大学录取的最重要因素是研究潜力:你有多大可能成为一名优秀的研究人员?主要的直接指标是研究潜力的重要性:业内大佬的建议:受人尊敬的教授高度评价你,所以人际关系很重要。研究经历:之前做过什么成功的研究、发表的论文(是否为第一作者和发表所属期刊、会议的声望)。其他间接因素有时可能有所帮助,不过作用并没有以上两个因素大,按重要性排序:本科大学背景:有些大学会很看重,其他一些大学并不care;工作/实习背景:例如以前曾在金融或Google,Facebook等公司工作过;智力:完美的GPA,完美的GRE与智力有些相关(或至少与你学习和理解的速度有关);勇气/责任心:你在持续被拒绝、遭遇失望和失败的情况下都能表现得很好,如果你遇到并克服了困难,你可以将你的故事纳入自我陈述中。成就:赢得了数学或CS比赛。表彰:赢得了非常厉害的奖学金。擅长数学或工程学:为开源项目开发作出贡献或者使用过研究代码。家庭背景:父母是教授,赢在起跑线上如何准备计算机科学博士申请材料首先是推荐信对于推荐信,可以分为四个类别:强、好、弱和坏。请注意,录取老师在推荐信中寻找的主要内容是关于你有多少研究潜力。这部分的主要目的是让申请者了解什么是好或强的推荐信,根据这些信息,你可以找到更适合帮你写推荐信的人。非优质推荐信的特征:推荐人知道你的不良事迹并且把这些写到了推荐信里,特别是在美国,任何甚至略微有污点的过去都非常有风险;推荐人并不认识你(你上过ta的课,但ta对你没有留下任何印象);推荐信内容很简短,只说你在课堂上表现很好;弱竞争力推荐信的特征:推荐人只在课堂上认识你;推荐人只能写一些关于你课上的表现;推荐人不评论你的研究;录取委员会或潜在的顾问都不认识推荐人。优质推荐信的特征:推荐人有一定名气,被录取委员会的部分人员知道;推荐人的姓名和工作至少被个人陈述中提到的一位潜在导师所知;推荐人与你一起做过科研;推荐人在轶事中提到了你出色的研究能力,这些事情证明了你的创造力、诚信、坚持和研究技巧;推荐人详细写了你如何发表研究报告;推荐人评论了你在实验室外的研究。强竞争力推荐信的特征:推荐人英语水平出色;推荐人因过去出色的推荐而闻名(之前推荐的学生非常优秀);推荐人在轶事中提到了你出色的研究能力,这些事情证明了你的创造力、诚信、坚持和研究技巧;推荐人提到了你的其他能力,这些能力间接地帮助研究(工程技能,演讲技巧,人际关系技巧),并将这些技能包含在轶事中。请注意以下几点:轶事很重要,这需要推荐人真的了解你。那些招生老师也能读得津津有味,毕竟读故事比核对清单更有趣;这封推荐信不需要包含上述中的所有要素,那样会让推荐信变得很复杂;推荐信需要有侧重点。怎样界定你发表论文、刊物的含金量?是否为第一作者?发表的论文、刊物是研究经验和研究技能的直接证据。如果你作为第一作者出版,人们就知道你完成了大部分工作。如果你作为第二作者出版,人们知道你做了很大一部分工作(25%-50%)。如果你的名字是第三个或更晚,你的贡献会大打折扣,但你可能会经历整个研究过程以获得发布资格并获得大量的研究经验。如果你发表了几篇第一作者论文和一篇第三作者论文,这样就看起来非常好:它表明你可以完成团队合作。发表论文所属会议、期刊的威望:如果你在一个顶会上发表你的作品,人们就会知道:(1)你的作品质量很高; (2)你的工作可以被信任; (3)你目前的研究技能足以在大型的会议上发表;(4)你具有竞争力,可以在顶级会议的压力下保持高效。在你未来的导师看来,这有助于看到这一点:如果你有两个学生,一个已经在NeurIPS(A级)发表,一个发表在B级会议上,那么这说明第一个学生可能已准备好参与明年针对NeurIPS的研究项目,第二名学生则需要进一步准备。对于第二个学生,这个学生可能需要一年多的时间才能获得在A级会议上发表所需的研究技能。如果导师和学生之间的磨合压力较小,那么就更容易建立强大的专业关系,这使得彼此合作更容易和有趣。毕竟谁都愿意找有准备的士兵去一起打仗。因此,未来的导师将有充分的理由根据你在哪个会议上发布论文进行选择。如何撰写个人目的陈述对于大多数高校而言,目的陈述主要是为那些不想花太多时间审核资料的校方工作人员提供“过滤器”。你的写作可以展示你的思考方式,如何营销,你如何解释事物,但它也可以透露出你是懒惰的,不注意细节。对于某些机构(例如CMU)来说,个人陈述可能很重要。除此之外,个人陈述也是唯一可以解释你在某些情况下为何表现不佳的文件。例如,你可以解释你在读研究生的过程中遇到的任何特殊困难,或者它可以解释为什么你在大学的某些学期里没有做到这么好。个人陈述的结构应如下:1、在第一段,通过引人注目的开头介绍研究兴趣,使读者想要阅读更多。这是最重要的一点:如果你不能让读者对本段不感兴趣,他们不太可能专注于整本书的其余部分;2、你在研究生学习期间的研究经历(大约一页);3、确定你将来要做的研究方向;4、确定选择导师以及选择原因;5、(可选)在适当的情况下解释情有可原的错误。在某些情况下,个人陈述可能非常重要。如果你表现出良好但不强或弱 的学术潜力,你就必须克服重大的困难才能做研究。然而,披露困难和弱点,如学习障碍和精神疾病,也可能是一把双刃剑:你可能让审核老师望而却步,也可能因为你坚持困境而表示同情和钦佩。如果你披露此类事实,则需要正确完成并且个人陈述需要非常精细化。如果你没有专人指导,请不要尝试这样做。毕竟你不只是在讲述如何克服经济困难完成学习,而是讲述你在患精神分裂症或双相情感障碍时遇到的困难。然而,如果你没有面对任何困难,不要编造毫无意义的故事:“作为一名白人、男性、上流社会的美国公民,我从很小的时候就被我的特权所困扰,我的学业表现受到了影响在这个过程中。“请不要这么拉仇恨,还是专注自己的研究能力吧。关于GRE、TOEFL、GPAGRE、TOEFL和GPA通常用作过滤标准。非常高的GPA可以成为良好指标,可以帮助那些质量不太高的推荐信和论文。但是如果你没有出版过论文,并且推荐信也很糟糕,4.0的GPA将无济于事,甚至可能还会起到反作用,因为它表明你专注于“无用”的课而不是研究。GRE和托福成绩是纯粹的过滤器:如果你有一个好的分数,你就不会被过滤掉。如果你有一个完美的GRE成绩,它可以帮助到一点点。高GRE成绩并不重要:我拿到了美国大学计算机科学专业TOP5中的三个:GRE成绩为语文159(81%),数学163(86%),写作5.0(93%)和托福120/120和GPA 8.1 / 10。任何高于3.5(满绩4.0)的GPA都可能会有所帮助。关于简历简历要列出你所做的事情。内容很重要,但内容也取决于你之前所做的事情,并且不能撒谎编经历。不要通过简单的方式或通过让你的简历看起来“漂亮”或“有创意”来“调整”你的简历,这是浪费时间。只需列出你所做的事情。了解一下申请程序(一)、如何向你的教授索取推荐信你可能需要写两封电子邮件:(1)只要问一下这个人是否可以给你一封好的或强烈的推荐信。经历丰富的推荐人如果认为他们不能给你写好的信,就会拒绝你的请求。在这种情况下,寻找其他人。(2)如果你的推荐人同意,她会要求你提供信件的一些信息。列出你和推荐人所有过的互动,让推荐人写得更生动:举个例子,需要写的是:“你在一次会议上告诉我,通过一些额外的工作,我们可以为NeurIPS截止日期做好准备。在接下来的两周内,我开发了一个改进的深度网络架构,开始撰写调查结果。接下来的一周,简扩展了我的代码以完成额外的任务。然后,我们有足够的结果将我们的工作提交给NeurIPS“不要写:“简和我在NeurIPS上发表了我们的研究。”(二)个人目的陈述尽早开始向有经验的人询问意见。如果你想透露你在读研究生的路上遇到的困难,你需要花很多时间在你的个人陈述中,你可以在你所有的申请材料中花最多的时间在这方面。也可以参考你之前申请大学时使用的个人陈述,这或许能帮你省不少时间。(三)在线申请尽早开始填写在线申请表。有些流程很复杂,需要一些时间来填写,如果你能尽早地提交,专注于写推荐信、院校选择和个人目的陈述,那就太棒了。另外,你应该准备足够的资金来做这些申请。整个过程可能花费高达1000美元。如果你没有足够的钱,请尽早向一些亲戚寻求帮助。想要读计算机科学博士,该如何选择学校?我可以考上顶尖学校吗?许多读这篇文章的人可能有着进入斯坦福大学,麻省理工学院,伯克利大学或CMU等顶尖学校的梦想。但这非常困难,竞争非常激烈。分享一下我申请的一所牛校的情况,以下几条都是申请这所牛校的人的背景条件:申请人中本科学校Top2的比例:38%Top4:52%Top20:73%每个国家的顶尖学校:84%至少4篇顶级会议论文:93%至少3篇顶级会议论文+最佳教师/青年科学家奖:98%也就说,84%的申请人来自一个国家的顶尖学校,另外你在顶级会议上的论文少于3篇,那么你进入上述学校的概率约为2%。如何入读顶尖学校?上述统计数据并不意味着你无法被这些学校录取,但这意味着如果你的个人资料太弱,你应该再花一年时间来完成梦想。例如,我将我的硕士学位延长了一年,以便进行一年的研究型实习。如果没有这份经历,我基本不可能进入这些学校。如果你的梦想是进入这些顶级学校之一,研究型实习是迄今为止最好的选择。即使你不一定想去这些顶尖学校,研究实习也没什么坏处。研究型实习将为你提供:提高研究技能,使你可以更轻松地开始攻读博士学位;测试博士或某个研究方向(NLP与计算机视觉与系统)是否适合你;一份好的甚至是竞争力强的推荐信(实习时间越长越好);发表论文的机会。现实的学校选择你应该申请大约10-15所大学。如果你申请更多,那么你将面临着没有足够时间来真正完善你申请流程的危险。如果你申请的数量少,你会遇到手上无offer的危险。你应该有一个或两个备用大学,你被录取的几率> 75%。通常,你已经就读的大学是一个很好的候选,因为你的推荐人将导师所知。申请所有有希望入学的顶尖大学(> 10%的机会)。在剩下的大学里挑选一些你有意愿去的,你希望入学率会较高(25-33%),你应该至少备选3所这样的大学。这些大学通常是推荐人和你都希望与之合作的教授的所属大学,这时候人际关系就起到重要作用了。请注意,最好的导师不一定在顶尖学校。你可以在前20名以外的学校获得优秀的博士培养。但是,如果你考虑学术生涯,那么学校的级别将非常重要,你应该尝试在顶尖学校找到一名导师。选择大学主要是根据这所大学里的导师。确保每所大学都有多个你想要合作的导师。不要申请只有一位优秀导师的大学。如果你选择的专业范围太小,请扩大你感兴趣的区域。例如,如果你想进行深度学习和NLP,并且找不到足够的合适导师,请考虑计算机视觉或其他领域的一些导师。其他问题(一)注意:英国博士需要四年,美国博士需要6年在美国博士学位课程的前1-2年,你将完成不少课程,因为美国博士学位是为本科生设计的。相反,英国博士学位课程专为已经拥有(1年)硕士学位并且课程很少的学生而设计。具体区别如下:美国博士专为本科学生设计课程为1 - 2年,课程分散了研究的注意力,入学时有担保资金,即你有担任研究助理或助教的职位。英国博士专为硕士生设计课程为0.25 - 0.5年,你可以从头到尾专注于你的研究。资金方面可能有问题,通常取决于你的导师。这就是为什么在申请之前与潜在导师取得联系非常重要的原因。还要注意地区差异。如果你在美国学习,你也将陷入美国的研究泡沫。如果你在欧洲或亚洲学习也可能如此。如果你想加入欧洲的学术界,而且无法进入美国顶尖学校,那么申请大多数欧盟大学可能是更保险的选择。(二)博士需要硕士学位吗?在欧洲大陆,学士学位通常为3年,你需要硕士学位才能获得博士学位。在美国和英国,博士通常为4年,你可以在学士学位之后立即开始攻读博士学位。(三)工作经验很重要吗?如果你在着名的公司(谷歌、Facebook、麦肯锡、高盛等)工作,它尤其有用。如果它与软件工程相关,其他工作经验也有帮助,但任何研究经验(研究实习)都要比企业实习有用得多。只是一份好工作而没有研究经验,对你没有帮助。(四)如何挑选导师?查看他们最近出版的论文,从而找到共同的兴趣点。避免与最近没有发表论文的学者合作。在当前的研究中不需要重叠,但你应该对导师正在进行的研究感兴趣。查看他们之前的毕业生名单以及这些师兄师姐现在从事的职业,毕竟就业也是考量的一个重要指标。查一下导师是不是创业吗?他有多少学生?这些因素的组合可以给你暗示:这个导师忙不忙,他又有多少时间来指导你。根据你在研究方面的经验,你将需要一个或多或少有时间的导师。(五)我必须要拥有博士学位吗?如果你想在学术界工作,你需要博士学位。在商业中,一切都受供需关系的制约。未来几年,人工智能研究人员的供应将急剧增加。如果AI炒作崩溃,需求将会消退。这种情况可能与数据科学家在2018年面临的情况非常相似:公司只接受非常优秀的申请人,因为供应量大于需求量。在这种情况下,如果你想要转换工作或想要晋升,博士学位将会有很大的不同。你现在可能没有博士学位,但没有博士学位,如果你想转到另一个研究实验室,你可能会遇到问题(因为熟练的博士学位可能很高,而需求很低)。如果AI炒作没有崩溃(不太可能),那么你可以在没有博士学位的情况下轻松找到并转换工作。如果你对研究工程师的职位感到满意,那么博士学位对你来说可能毫无用处。由此,如果你不想做研究,就不要做博士学位。(六)我该在申请前请联系导师吗?不要对美国的教授这样做。在欧盟,有时需要在申请前联系可能的导师。如果你需要这样做,请尝试通过真正了解你导师的人介绍,例如,你的学士或硕士论文导师。如果你与这位导师没有私交,你还想写一封电子邮件的话,内容建议如下:你当前的导师是谁;关于你过去工作的总结(可选:你在哪里发表你的作品);关于你可以以“想法:一句话解释这个想法”的形式向导师解释你想要的研究方向;如果你没有个人联系,你的潜在导师不太可能回复你。如果你没有人际资源并且你申请了欧盟(英国)大学,那么你可能需要试试申请其他地方。(七)如何为你的研究计划选择一个主题?研究提案的主题无关紧要。没有人会要求你做在研究提案中描述的工作。你可以根据在不同申请中重复使用的容易程度来选择你的研究提案主题。如果你不需要为不同的申请流程重写它,则可以节省大量时间。需要考虑的一件事:你对某个主题越熟悉,就越容易编写好的提案。参考链接:http://timdettmers.com/2018/11/26/phd-applications/新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手_2 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。
数据科学(DS),即从数据中提取有用知识的一系列技能和技术。DS是大数据时代发展最快、薪资较高、前景最好的新兴专业之一,虽然申请学术门槛较高,依然被大家所青睐。恭喜L同学成功斩获纽约大学(2021 US News综排TOP30),数据科学硕士录取offer!L同学,本科学校:美本;本科专业:应用数学;三维成绩:GPA 3.8,GRE 320+;一、录取过程L同学的本科专业是应用和计算数学的DS方向,对于申请DS专业来说非常匹配,GPA与GRE成绩也基本符合名校项目的录取要求,因此导师很快就为TA划定了适合的选校区间。L同学的软背景相对于硬件方面的条件来说,优势不太明显,实习与科研经历都较为浅薄,缺少具有决定性的成果展示。所以导师在文书的创作过程中,不断与L同学进行头脑风暴,并针对TA与教授的一些想法给予了专业的建议,海外导师也从专业度的方面精准切入,帮助L同学拔高了文书的学术质量。NYU的DS项目与地理位置都令L同学非常满意,最终也如愿拿下了录取,同时,TA也还在等待着更为顶尖的offer到来!二、数据科学专业Part 01专业定义数据科学(DS),即从数据中提取有用知识的一系列技能和技术。这些技能通常可以用德鲁·康威(Drew Conway)创造的维恩图(或它的变体)来表示(如下图所示)。三个圆圈分别代表三个不同的领域:编程领域(语言知识、语言库、设计模式、体系结构等);数学(代数、微积分等)和统计学领域;数据领域(特定领域的知识:医疗、金融、工业等)。这样的定义使得DS理所当然地成为了一门“交叉学科”,也得以因此取百家之所长,成为了大数据时代里发展最快、前景最好的新兴专业之一。Part 02就业方向DS专业在就业方面的出口则大抵分为Data Scientist(数据科学家),Data Engineer(数据工程师)与Data Analyst(数据分析员)这三种。Data Scientist的主要工作内容是建立统计模型,设计实验(A/B Testing),发现data insight等,要有扎实的数学功底,不错的编程技术来实现模型(Python)以及良好的商业意识。Data Engineer,主要工作是建立数据科学的pipeline,一般需要对大数据平台非常熟悉,熟练掌握Hadoop,Spark等技术,对统计建模要求不高,但需要有很好的编程能力。Data Analyst,主要职责则是数据处理,简单的分析和可视化。三、NYU的DS项目Part 01课程设置NYU的DS项目隶属于Graate School of Arts and Sciences学院(文理学院),项目总时长为两年(也可以一年半读完,但学业压力会很大),共有四个学期,学生在毕业前需修完36学分。这36学分是由必修和选修两部分组成的,以下6节为学院公布的必修课程,学生在就读期间必须修完以下课程:该项目的课程标准是每学期修读超过9学分。硕士课程一般是3学分,一般来说学生需要在一个学期修完3门课,学生可以根据自己的专业背景与学习目的,自由安排选课。需要注意的是,在大部分课程里会用到的编程语言都是Python,有意愿的同学可以尽早准备。Part 02录取要求作为交叉学科的DS项目,往往对于申请者的本科专业并不设限,NYU亦是如此。在以往的成功录取中,申请者的背景也是涵盖了统计学、计算机科学、数学、工程学、经济学、商业、生物学、物理学和心理学等在内的各领域学科。不过该项目需要申请者具备良好的数学基础和编程能力,且由于多个“王牌”课程的授课内容都是基于大量领域内基本知识之上,数理编程能力不过关的同学应对起来会非常吃力。在学校列出的先修课清单中,包括了微积分、线性代数、基本的计算机科学课程以及概率论、统计学、高阶物理学、工程学、计量经济学与高阶微积分的其中之一,有申请意愿的同学可以以此为标准提前进行补课。在GRE和GPA成绩方面,虽然项目对两者都没有设立最低标准,但我们可以从往年的录取平均值来进行比对和自我衡量。在2020年的录取数据中心,平均GPA为3.75,平均GRE量化成绩则为166.96,学术门槛还是比较高的。Part 03就业情况作为世界上最早的授予学位的数据科学计划之一,NYU的CDS(数据科学中心)由Yann LeCun博士于2013年创立,以响应学术界、工业界和政府对数据科学家日益增长的需求。创立时间早所带来的好处,便是NYU的DS项目在业内早已开拓了完善的资源市场,与雇主之间的联系也非常紧密,这一点对于学生的毕业求职非常关键。另一方面,NYU地处于纽约曼哈顿中心,大学在设计的时候也并没有使用院墙将学校与城市隔离开来,而是将校区和整个纽约市融为了一体。所以NYU在平时可以充分利用纽约市的大量资源,纽约丰富多元的生活方式,繁荣的商业资源,为学生提供了大量实习,实践和探索的机会,这样的优势对于数据科学领域的学生来说则无疑更为明显。此外,NYU的DS项目还在课程的最后一年设立了“Capstone Project(顶点课程)”,学生将通过这一课程获得解决现实世界问题的独特机会。学生可以借此机会参与“实战演练”,把自己此前所学知识和技能应用于解决实际问题,为后续的进入职场做好了铺垫。