欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
想从事数据分析工作考研应该选择什么专业咲人

想从事数据分析工作考研应该选择什么专业

当前正处在大数据时代,而数据分析是大数据技术体系中的重要组成部分,也是数据价值化的主要方式之一,所以未来从事数据分析工作是不错的选择。数据分析可以选择两个大的专业方向,一个是统计学专业,另一个是大数据专业,另外不少计算机相关专业、金融领域相关专业和数学领域的相关专业也都有数据分析的细分方向。随着数据分析的重要性日益体现,现在不少专业也都增加了数据分析的细分方向,比如经济学、社会学、医学等专业都陆续开设了与本专业相关的数据分析方向。具体选择哪个专业需要根据自身的知识结构来决定,最好能够结合本科专业进行选择,这样在备考的时候会轻松一些。如果本科是计算机相关专业,那么可以选择的余地是比较大的,计算机应用、计算机科学与技术、软件工程等专业都有数据分析的细分方向,当然统计学和数学专业也是如此。在大数据领域,数据分析通常有两种方式,一种是统计学方式,另一种是机器学习方式,两种数据分析方式同样重要。学习数据分析通常需要具备一定的数学基础、统计学基础和计算机基础,其中数学基础是相对比较重要的,要想在数据分析领域走得更远,一定要重视数学相关课程,包括高数、线性代数、概率论等内容。以机器学习的数据分析方式为例,需要具备算法基础和编程语言基础,机器学习的步骤包括数据收集、数据整理、算法设计、算法实现、算法训练、算法验证和算法应用,目的就是从一堆杂乱无章的数据中找到其背后的规律。当前机器学习的数据分析方式是比较流行的,相关领域的研究也在逐步推进。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网方面的问题,或者考研方面的问题,都可以咨询我,谢谢!

天地并与

大数据分析方向的就业前景如何

首先,近年来大数据相关方向(包括分析)的毕业生就业情况还是不错的。由于大数据目前正处在落地应用的初期,所以未来随着产业互联网的发展,大数据分析岗位的就业前景还是十分值得期待的。大数据技术是产业互联网的核心技术之一,而产业互联网将是未来互联网行业发展的重要方向,也是广大传统行业实现结构性升级,完成“互联网+”的重要选择。随着大数据技术的逐渐落地,在人才需求上将体现出以下几个特点:第一:数据分析将率先得到落地应用。当前大数据分析是实现数据价值化的主要方式之一,尤其是场景数据分析,所以在大数据落地应用的过程中,数据分析的应用将率先得到产业界的认可和普及,这个过程必然会释放出大量的人才需求。第二:人才需求从研发型人才向技能型人才过渡。在大数据研发的初期,需要大量的研发级人才,因为需要解决大量的技术难题。随着大数据相关技术的逐渐成熟,在大数据落地应用的过程中则需要大量的技能型人才。大部分职场人通过一个系统的学习过程,都会掌握一定的数据分析技术。第三:数据分析的应用领域逐渐拓展。随着产业结构升级的持续推进,数据的价值将逐渐得到体现,而基于数据的管理模式也将逐渐得到普及。更多的企业将以数据为基础来提升企业的创新能力、管理能力和服务能力,而数据分析则是提升这些能力的基础部分。相信,未来数据分析领域的人才需求将得到逐步的释放,人才需求的类型也将呈现出多样化。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网方面的问题,或者考研方面的问题,都可以咨询我,谢谢!

受揖而立

大数据分析有几个就业方向?分别需要哪些技能?

IT行业对于大数据人才的需求量比较大,一方面岗位级别比较高,另一方面薪资待遇也比较可观,而且薪资待遇正呈现出逐年上升的发展趋势。大数据分析哪些就业方向呢?数据分析可分为两类:一是偏向产品和运营,更加注重业务比如数据分析/数据运营/商业分析,主要工作包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等。这类岗位的职位描述一般是:负责和支撑各部门相关的报表;建立和优化指标体系;监控数据的波动和异常,找出问题;优化和驱动业务,推动数据化运营;找出可增长的市场或产品优化空间;输出专题分析报告。需要掌握Excel+SQL/hive,了解描述统计学,知道常见的可视化表达,了解一些Python编程,足够完成大部分任务。二是更注重数据挖掘技术,门槛较高比如数据挖掘工程师/算法专家,数据挖掘工程师,往后发展,称为算法专家。要求更高的统计学能力、数理能力以及编程技巧,需要扎实的算法能力和代码能力。除了掌握算法,必须精通SQL/Hive,需要编程能力,Python、R、Scala/Java至少掌握一种,往往也要求Hadoop/Spark的工程实践经验。因为要求高,所以平均薪资高于数据分析师。大数据学习的选择上,加米谷给几条建议吧:第一,选择城市,一二线大城市工资高,岗位也多,这样学习完以后容易找到工作,虽然说大城市压力大,但坚持两年再去小城市,可以增加你的含金量;第二,如果你没有java开发经验,想0基础开始学习大数据,建议一定要把Java基础打牢(大数据开发方向学Java,数据分析方向学Python);第三,培训机构的选择,你可以先去听下试听课,或是学习基础班,看看效果。推荐一些数据分析师入门书籍:《深入浅出数据分析》HeadFirst系列,内容很浅,比较适合没有基础的人作为科普读物,适合快速入门;《统计数字会撒谎》本文不涉及枯燥的数学公式与推理过程,通俗易懂,其实讲的都是统计学最基本的常识,可是却往往容易被人所忽视;《谁说菜鸟不会数据分析》不错的工具类书籍。比较浅显,适合完全没有Excel或对Excel似懂非懂的人。 讲了一些方法论的东西,但是非常的简单,不太适合对Excel熟悉的读者;《深入浅出统计学》帮你快速了解统计学相关的知识。加米谷大数据培训。

达道之塞

普通大学数据科学专业,该选择主攻研发方向还是数据分析方向

首先,从就业的角度出发,对于普通大学的本科生来说,选择大数据研发方向是比较现实的选择,也就是我们通常所说的开发岗,随着大数据技术的落地应用,产业领域会逐渐释放出大量的开发岗位,而且相对于数据分析岗位来说,开发岗对于人才类型的需求也比较多元化。大数据领域当前的岗位需求主要集中在三大方向,分别是大数据开发、大数据分析和大数据运维,其中大数据分析岗位虽然人才需求量也比较大,但是要在IT互联网领域从事专业的大数据分析(算法)岗位,难度还是比较大的,当前算法岗位往往都需要研究生以上学历,不少博士生也在竞争算法岗,所以整体的就业难度还是比较大的。对于本科生来说,如果要想从事大数据开发岗位,应该从三个方面做好准备,其一是重视编程语言的学习,可以重点关注一下Java语言,虽然当前Python语言在大数据领域的应用也比较多,但是选择Java语言往往有更多的就业机会,Java语言在生产场景下的应用还是比较多的。其二是重视大数据平台知识的学习,大数据平台可以从Hadoop、Spark开始学起,要重点了解大数据平台的技术构成,熟悉其中的API。由于大数据平台的知识量比较大,所以整体的学习周期会相对比较长,要想有一个更好的学习体验,应该结合实践场景来边用边学。其三是重视实践和交流,这对于提升学习效率还是非常重要的,实践能够促进大数据知识的深入学习,而交流能够帮助初学者突破各种学习障碍,当前可以利用互联网来为自己开辟出更多的实践和交流场景。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以私信我!

夏丽

数科专业未来想从事数据分析岗位,考研如何选择专业和方向

首先,如果想从事专业的数据分析岗位,读研确实是一个比较现实的选择,相对于开发岗位来说,数据分析岗位的竞争还是比较激烈的,除了计算机相关专业的同学可以从事数据分析岗位,数学、统计、金融、经济等专业的同学,也都可以从事数据分析的相关岗位。近些年来,随着大数据、人工智能等技术的快速发展,行业领域对于数据分析人才的需求量还是比较大的,尤其是IT互联网行业,新增了大量的数据分析岗位需求,但是随着人工智能技术在落地应用过程中并没有预期那么顺利,所以数据分析等算法类岗位的人才需求量,出现了一定程度的下降,这也导致了就业竞争越发激烈。如果明确要想往数据分析方向发展,而且想有一个较强的岗位竞争力,考研可以重点考虑一下计算机专业,在主攻方向的选择上可以选择大数据和人工智能大类,然后围绕数据分析岗位的要求来组织知识结构和开展科研实践。在专业选择上,之所以选择计算机专业,原因有三点,其一是相对于大数据专业和人工智能专业来说,计算机专业的学科体系比较成熟,会有一个比较好的学习和科研体验。其二是计算机专业可以培养自己的开发能力,这对于提升就业竞争力还是非常有帮助的。早期从事算法岗位甚至不需要掌握编程,但是当前很多算法岗位对于程序开发能力是有要求的,尤其是IT互联网行业内的企业,往往更加看重算法工程师的程序设计能力。其三是计算机专业的就业渠道更多一些,尤其在当前工业互联网发展的大背景下,产业领域会释放出大量计算机专业人才的需求。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以私信我!

美容院

大数据专业女生该选择研发方向还是数据分析方向

首先,大数据研发和大数据分析这两个方向都有大量的人才需求,而且随着大数据技术逐渐开始落地应用,未来传统行业领域也会需要大量的大数据人才,这其中既包括大数据研发也包括大数据分析。从近两年大数据领域的人才需求情况来看,大数据研发岗位的人才需求量还是相对比较大的,而且岗位附加值也比较高,不少大数据方向的研究生也更愿意从事研发岗位。实际上,当前以大数据分析任务为主的算法岗位,在人才招聘数量上并不算多,这也导致不少想从事算法岗位的毕业生,最终选择了研发岗位。选择大数据研发方向在当前大数据应用的初期往往更为稳妥一些,一方面大数据研发方向除了可以从事大数据研发任务之外,还可以从事传统的软件研发岗位,这就在很大程度上扩展了自身的就业渠道,另一方面传统行业目前的大数据应用尚处在初期,大数据研发任务要更多一些。当然,从未来发展的角度来看,大数据分析方向未来的人才需求潜力还是非常大的。对于女生来说,在选择大数据研发和大数据分析时,还需要考虑到自身的能力特点,如果程序开发能力较弱,但是数学基础比较扎实,那么应该重点考虑一下大数据分析方向。实际上,当前确实有更多的女生愿意选择大数据分析方向。最后,不论是选择大数据研发方向还是大数据分析方向,整体的知识量还是比较大的,要想有一个更好的学习体验,最好要结合实践场景进行学习,一定要充分利用好学校的学习资源,比如数据中心等等。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以在评论区留言,或者私信我!

笨小孩

想做数据分析,应该学什么专业呢?

自从人工智能和大数据的概念大热,理工科的学生纷纷转去申计算机科学或数据科学,而文科的学生则把目光投向了商业分析。大家都期望学习最先进的计算机和数据分析技术,毕业后进入大公司,成就一番事业。这说明现在学生都比较关注社会发展的动态,有很好的就业意识。但是我在这里想说,其实从事数据相关工作和学什么专业关系并不大。尤其是把眼光放到部门级领导或以上,就跟专业更没什么关系了,接触过几百个企业,但是并没有看到特别集中的专业,可见后天努力比先天选专业更重要。但是专业、学校、学历是大家求职的敲门砖。特别是高等教育越来越普及,即使都是敲门砖,总有一些砖比其他好使。接下来我们从硬实力和软实力这两个方向分别来介绍比较适合大数据分析的“砖”。硬实力数据分析师需要学生有一定的数学、计算机背景,从这个出发点来说,数学、统计、计算机科学等专业可以从事数据分析工作。数学随着科技事业的发展,数学专业和其他专业的联系也越来越紧密,所以数学专业知识也得广泛的应用。看到数据分析,就会想到和数据相关的行业就一定要用到数学,数据分析师需要有专业的数学功底和严密的逻辑思维,而严密的逻辑思维则来源于扎实的数学功底。学数学的同学更注重理论的完备性和逻辑链的完整性,即对于在分析过程中出现的任何一些命题,都要能证明它是正确的还是错误的。统计学统计学贯穿数据分析的全过程,没有统计学基础,很难有专业的数据分析。数据分析的各个步骤,都要用到统计学的知识。和数学相反,统计学是个被名字拖累的专业,会让人严重低估了它本身的专业性。其实统计学是很适合做数据相关工作的。计算机相关专业学习计算机专业同学可以从事数据研发/开发工程师,数据挖掘/机器学习工程师,对编程技术上的要求高一些。近年来企业招的数据分析师,其实大部分应该叫:数据程序员。基本上都是进公司跑数据的,不做啥“分析”,因此计算机相关专业会有优势。毕竟写代码写的多。数据仓储,算法这些就更依赖开发能力,这本来就是计算机专业的范畴。不过,这三个专业的同学可以虽然可以处理大量数据,并且拥有很强的数据分析能力,但是这类同学对于Business 和 Marketing缺乏了解,数据分析的结果对于企业并无太大收益。软实力软实力要求学生懂业务、懂管理,从这个出发点来说,信息管理、市场营销、电子商务、社会学、金融学等专业毕业后也可以从事数据分析相关工作。信息管理信管专业主要对各种“系统”进行分析、设计与实现,技术与管理的有机结合。学习内容:财务、系统数据分析、IT技术,可以说信管专业非常对口数据分析师职位,从信息中 发掘财富。与计算机结合,使计算机作为工具, 信息管理更加有效和实用,随着企业经营规模的现代化,对信息管理 的要求越来越强烈。例如铁路订票系统,就是对车票这种信息的查询和管理系统。可以说软件开发的最主要面向的客户就是 帮助企业制作良好的信息管理系统。市场营销数据分析师常要为企业的营销决策提供支持,这就要求懂营销。具有营销背景的数据分析师思路会更清晰、更开阔。当让他做竞争分析时,他会想到波 特五个力;让他做环境分析时,他会想到PEST、让他做消费者偏好分析,他会想到科特勒用户决策流程。电子商务电子商务专业培养具备管理、经济、法律及网络技术、计算机技术、市场营销、电子商 务技术以及电子商务管理等方面的知识和基本技能,现在各大交易都在网站等网络平台 交易完成,数据分析在电商行业的应用非常广。心理学、社会学不要小看这两个专业,这两个专业对于数据的应用能力绝对很高。知乎著名数据大V chenqin就是搞社会学的,其数据分析能力压倒一大堆只会跑数的人。心理学里提假设、设计实验、采集数据、验证假设的思路,就是数据分析的思路。因此这两个专业的数据部门领导还挺多的。金融学金融学课程一般包含经济学、管理学、会计学、统计学等等,不管是数据分析中的统计还是应用都有涉及。金融行业的数据分析师岗位需求大、薪资高,如今“特许全球金融科技师CGFT”认证项目的推出,使得数据分析的学习更有针对性和权威性,此项目由上海交通大学与上海高金金融研究院联合打造,通过职坐标的针对性学习以及考试即可获得此证书,使得步入数据分析行业的步伐更稳健。不过,这几个专业在业务方面可能专业度非常高,但是缺点也是非常明显的:缺乏很强的数学和计算机背景,在实际操作中缺乏相关的专业技能。其实完完全全和数据没有关系的专业很少。因为几乎所有的理工专业都要做实验,都设计数据、统计等理论,几乎所有文科专业都要学市场调查,都要搞实证研究。更本质的看,数据分析是一种技能,人人可以学,学了都有用。这是个要用数据说话的年代,懂点数据相关知识可以更好的服务工作与学习。学校和专业是敲门砖,但是技术和经验在这个社会中是优于这些的存在。不管你有没有一个好专业,好学历,最重要的一点,请别忘了,要坚持学习和进化!

封神劫

数据分析有哪些方式以及应该如何学习

数据分析目前是数据价值化的主要方式之一,也是大数据主要的落地应用方式之一,随着大数据技术逐渐普及到广大的传统行业,对于职场人来说,掌握一定的数据分析技术还是有必要的。数据分析目前有两种主要的分析方式,一种是机器学习的方式,另一种是统计学方式,对于基础比较薄弱的学习者来说,可以从统计学方式开始学起。通过统计学的方式进行数据分析可以使用多种工具,比如Excel就是比较常见的数据分析工具,在分析结构化数据,以及数据量并不是特别大的情况下,Excel还是比较方便的。对于职场人来说,Excel可以应付大多数情况下的数据分析任务。如果对于数据分析有进一步的要求,接下来就需要学习数据库知识了,重点在于Sql语言的学习,掌握数据库之后可以继续学习BI工具的使用,BI工具的数据分析功能还是比较强大的。机器学习也是目前比较流行的数据分析方式,相比于统计学方式来说,机器学习的数据分析方式可以应对更加复杂的数据分析任务。机器学习的步骤包括数据收集、数据整理、算法设计、算法实现、算法训练、算法验证和算法应用,机器学习的核心是算法设计,基础是数据收集。机器学习式的数据分析是一种基于“模型”的数据分析方式,目前在人工智能领域,通过构造模型能解决大量的问题。学习人工智能也可以说是学习如何构造各种“模型”,以及如何让模型能够动态适应各种场景。通过机器学习的方式来完成数据分析可以从编程语言开始学起,比如Python就是不错的选择。一方面学习Python可以完成“爬虫”的编写,这样就可以解决数据来源的问题,另一方面Python也是机器学习比较常见的实现语言,Python中的Numpy、Matplotlib、Scipy、pandas等库会在很大程度上提升实现的效率。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。如果有互联网方面的问题,或者考研方面的问题,都可以咨询我,谢谢!

星云

3大领域,4大方向,做好数据分析岗位的职业规划

编者按:本文来自公众号秦路(ID:tracykanc),作者秦路;36氪经授权发布。最近有不少同学在后台问我数据分析的职业发展相关,这里先列一个简易大纲。它更多是以我所在的互联网行业展开的。入门和职业规划应该从两个角度考虑:领域和路线。领域是不少新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。譬如金融领域的风控模型、营销领域的生命周期、广告领域的点击率预估等,各有各的特色。如果是一位应届生,不妨多了解自己感兴趣的领域,和专业相关是最好的,并且积累相关的经验,为面试做准备。如果已经有一定行业履历,只是想要转岗数据分析师,那么跨岗不跨行,避免跳到一个陌生的领域。领域经验太宽泛,我给不了太多的指点,主要也就三点:1.自己感兴趣的,2.自己擅长的,3.有钱途的。从职场生涯看,成为某领域的数据专家,会是一个更好的筹码。而路线大致可以划分成四大方向:数据分析,数据挖掘,数据产品,数据工程。数据分析/数据运营/商业分析这是业务方向的数据分析师。绝大部分人,都是从这个岗位开始自己的数据之路,也是基数最大的岗位。因为基数大,所以这类岗位通常鱼龙混杂。有些虽然叫数据分析师,但是每天只需要和Excel打交道,完成leader布置的表格整理工作就行。混个几年,成为一位数据分析主管,给下面的新人继续布置Excel任务。又有一种数据分析师,岗位职责要求你掌握常用的机器学习算法,面试首先推导一个决策树或者逻辑回归。入职后也是各类代码,和分析打交道的情况不多。都叫数据分析师,其实天差地别。这里更多指互联网行业,偏业务的数据分析师,一般属于运营部门。不少公司也称数据运营或者商业分析。这类岗位的职位描述一般是:负责和支撑各部门相关的报表;建立和优化指标体系;监控数据的波动和异常,找出问题;优化和驱动业务,推动数据化运营;找出可增长的市场或产品优化空间;输出专题分析报告;实际情况是,不少业务端的数据分析师,主要工作只做第一点。别管它用汇总、分析、数据支持什么修饰词,基本是跑SQL,做报表。硬生生活成了业务端的表哥。这是很常见的情况,也是入门新人的第一个坑。因为从头到尾,这类分析师,都没有解决问题。业务部门往往更关心,某个指标为什么下跌或者上升。产品的用户是什么样的?怎么能更好的完成自己的KPI。以活跃指标的下跌举例:活跃指标下跌了多少?是属于合理的数据波动,还是突发式?什么时候开始的下跌?是整体的活跃用户下跌,还是部分用户?为什么下跌?是产品版本,还是运营失误?怎么解决下跌的问题这是一套标准的解决思维。分别对应what、when、who、why、how,每一部分都不是三言两语可以解释清楚。不要看它简单,例如你通过多维分析,发现某个地区的活跃下跌了,不要急着把它作为分析的结论,这是不合格的数据分析。某地区的活跃下跌,只是现象,不是原因,把它作为结论提交,肯定会被骂的。你要解决的是,为什么这个地区的活跃下跌了。是该地渠道,是该地竞争对手,是该地市场环境?这些问题都是细化深入的范畴。并且,它们要能以量化解释,而不是我认为。做好了这点,才是一个真正的业务端的数据分析师。当然,这一点看的是leader。leader能否带你进入业务分析的大门,决定你将来是不是成为一个表哥。新人切记切记。解决问题是一方面工作,另外一方面,数据分析师的职责是将业务数据体系化,建立一套指标框架。活跃下跌的问题,本质上也是指标问题。什么时候开始下跌,哪部分下跌,都能转化成对应指标,如日活跃用户数,新老用户活跃数,地区活跃数。你不能衡量它,就无法增长它,指的就是指标体系。指标体系可以是业务部门建立,但数据分析师也挺合适。一方面他们比数据挖掘这类技术岗位更贴合业务,一方面不像业务岗位对数据抓瞎。两者结合,这岗位也能称为数据运营。指标体系如果工程化自动化,也就是BI,所以数据分析师可以算半个BI分析师,这里不包括BI报表开发。BI如果采购第三方,数据分析师负责BI没问题,如果自有开发,那么BI岗技术的色彩更浓厚。数据分析思维和业务的理解,是分析师赖以生存的技能。很多时候,工具是锦上添花的作用。掌握Excel+SQL/hive,了解描述统计学,知道常见的可视化表达,足够完成大部分任务。机器学习这类能力,对此类数据分析师不是必须的,Python也一样,只是加分项。毕竟为什么下跌,你无法用数据挖掘解答。数据分析师是一个基础岗位,如果专精于业务,更适合往管理端发展,单纯的工具和技巧很难拉开差距。数据分析的管理岗,比较常见的有数据运营经理/总监,数据分析经理等,相对应的能力是能建立指标体系,并且解决日常的各类「为什么」问题。商业/市场分析是另外一个方向,更多见于传统行业。你要开一家超市,你得考虑哪里开,这就要考虑居民密度,居民消费能力,竞争对手的多寡,步行交通距离,开车交通距离等。这些数据是宏观的大指标,往往靠搜索和调研完成,这是和互联网数据分析师最大的差异。若往其他分支发展,比如数据挖掘工程师,则要继续掌握Python和机器学习等。从业务型发展上来的好处是接地气,具备商业洞察力(天天搞报表,怎么可能不熟),这点是直接做数据挖掘,或者程序员转岗,所不具备的。新人,比较普适的发展路线是先成为一位数据分析师。积累相关的经验,在一两年后,决定往后的发展,是数据挖掘,还是专精数据分析成为管理岗。学习资料:这里对学习资料不再多做推荐,看历史文章:如何七周成为数据分析师数据挖掘/算法专家这是技术向的数据岗,有些归类在研发部门,有些则单独成立数据部门。数据挖掘工程师要求更高的统计学能力、数理能力以及编程技巧。从概念上说,数据挖掘Data mining是一种方式,机器学习Machine Learning是一门方法/学科。机器学习主要是有监督和无监督学习,有监督又可划分成回归和分类,它们是从过去的历史数据中学习到一个模型,模型可以针对特定问题求解。数据挖掘的范围则大得多,即可以通过机器学习,而能借助其他算法。比如协同过滤、关联规则、PageRank等,它们是数据挖掘的经典算法,但不属于机器学习,所以在机器学习的书籍上,你是看不到的。除此之外,还有一个领域,属于最优化问题的运筹学。现实中的问题往往有很多约束,比如护士排班,一共有三班(早、中、晚),现在要求每班满足最低护士人数,每位护士尽量不能连班,每位护士不能连续工作5天。每位护士的夜班数要均衡,每位护士每月的班数要均衡…这些问题很难用机器学习的方法完成,而在最优化领域,则有遗传算法、模拟退火算法、蚁群算法等。实际的应用场景中,如外卖行业,如何寻找骑手效率最大化的最优路径,同样属于最优化,也是数据挖掘的工作范畴。数据挖掘工程师,除了掌握算法,同样需要编程能力去实现,不论R、Python、Scala/Java,至少掌握一种。模型的实施,往往也要求Hadoop/Spark的工程实践经验,精通SQL/Hive是必须的。常见数据挖掘项目的闭环如下:定义问题数据抽取数据清洗特征选取/特征工程数据模型数据验证迭代优化单看环节,数据挖掘对分析能力没有业务型那么高。这不代表业务不重要,尤其在特征选取方面,对业务的理解很大程度会影响特征怎么选取,进而影响模型质量。用户流失是一个经典的考题,如何选取合适的特征,预测用户会否流失,能够考察对业务是否深刻洞察。数据挖掘的业务领域一样可以细分。金融行业的信用模型和风控模型/反欺诈模型、广告模型的点击预估模型、电商行业的推荐系统和用户画像系统。从需求提出到落地,数据挖掘工程师除了全程跟进也要熟悉业务。因为要求高,所以数据挖掘的平均薪资高于数据分析师。一个分工明确的团队,数据分析师负责将业务需求抽象成一个具体的数据假设或者模型。比如,运营希望减少用户流失,那么设立一个流失指标,现在需要预测用户流失率的模型。模型可以是数据分析师完成,也能是数据挖掘工程师。最终由数据挖掘团队部署到线上。在一些公司,高级数据分析师会等价于数据挖掘工程师(其实行业内,对Title并没有严格的标准),只是工程能力可以稍弱,模型部署由专门的工程团队完成。数据挖掘工程师,往后发展,称为算法专家。后者对理论要求更严苛,几乎都要阅读国外的前沿论文。方向不局限于简单的分类或者回归,还包括图像识别、自然语言处理、智能量化投顾这种复合领域。这里开始会对从业者的学校和学历提出要求,名校+硕士无疑是一个大优势,也有很多人直接做数据挖掘。深度学习则更前沿,它由神经网络发展而来,是机器学习的一个子集。因为各类框架开枝散叶,诸多模型百花齐放,也可以算一个全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度学习框架,对模型的应用和调参也是必备的,后者往往是划分普通人和大牛的天堑。算法专家和深度学习专家,薪资level会更高一级,一般对应于业务型的数据运营/分析总监。数据科学家是上述岗位的最终形态之一,要么理论能力非常强,往往担任研究院的一把手。要么工程能力突出,上述的系统都能完成平台化的部署。这类岗位对基础知识要求扎实,所以书籍需要比较大的阅读量,而且要保持领域新论文的吸收。统计知识,除了「商务与经济统计」外,国外有一本「The Elements of Statistical Learning」,评价不错。机器学习的入门,李航的「统计学习方法」,周志华的「机器学习」都是好书,英文好也能看PRML。Python入门书籍的推荐太多,略过。「用Python进行数据分析」是必备的,当然这本书有点老,活用官网最新文档和stackoverflow,基本无碍。Python可视化查阅文档也够了,不用看书。再进一步,则是机器学习的代码实现,比较知名的有「集体智慧编程」,「机器学习实战」等。其实最近还有不少新书,「Python DataScience Handbook」等,我当然不可能都看过,所以也不好推(hu)荐(you)。除了基础,行业领域的也别落下,诸如推荐系统实战、计算广告…按需学习。如果你们公司对于人才有较高的挑战(一个人当两个人用),大概Spark/Hadoop机器学习相关的框架也得了解。数据产品经理这个岗位比较新兴,它有两种理解,一种是具备强数据分析能力的PM,一种是公司数据产品的规划者。前者,以数据导向优化和改进产品。在产品强势的公司,数据分析也会划归到产品部门,甚至运营也属于产品部。这类产品经理有更多的机会接触业务,属于顺便把分析师的活也干了,一专多能的典型。他们会运用不同的数据源,对用户的行为特征分析和挖掘,达到改进产品。最典型的场景就是AB测试。大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估。下图的案例,就是弱化心愿单按钮的存在感,让用户更多的聚焦在直接购买而不是收藏,最终让销售额提高了35%。俗话说,再优秀的产品经理也跑不过一半AB测试。此类数据产品经理,更多是注重数据分析能力,擅长用分析进行决策。数据是能力的一部分。后者,是真正意义上的数据产品经理。在公司迈大迈强后,数据量与日俱增,此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、BI、推荐系统、广告平台等。这些当然也是产品,自然需要提炼需求、设计、规划、项目排期,乃至落地。我们不妨看几个数据产品经理要求:负责大数据产品的设计,输出需求文档、产品原型;负责推荐算法的产品策略,完成相关推荐及个性化推荐产品的需求分析;负责分析和挖掘用户消费内容的行为数据,为改进算法策略提供依据;负责客户端数据需求的对接,制定相关埋点规范及口径,相关业务指标验证;报表展示工具的落地和应用;和C端注重用户体验不同,数据产品,更注重整体的分析能力和逻辑。除了产品经理最基础的Axure、Visio、MindManager等工具。往往还需要很多技术型的能力。比如了解BI/DW原理和实施、了解常用的推荐算法、了解机器学习模型等。这也很容易理解,C端要求你了解用户需求,而在数据端,主要用户就是数据。这当然不是说,用户体验不重要,拿推荐算法来说,除了满足用户最基本的感兴趣,也要考虑时效性,考虑新兴趣的挖掘,考虑无数据时的冷启动问题…这些一样是用户体验,只是解决方案也得从数据出发。再多思考一步,模型是离线还是实时,实时怎么实现它?技术细则不用多考虑,但你要知道会有这些坑。后端的数据产品,如报表,用户往往是你隔壁工位的小秦或小路,设计得丑一点不要紧,要是数据指标口径不统一,那才会分分钟骂街。虽然数据PM需要熟悉各类数据模型、指标、数据挖掘和数据工程的实现,但是聚焦点是把它作为一个项目去实现,故而不用精通。数据产品经理是一个比较新兴的岗位,所以有丰富经验的从业者并不多,我个人认为,还是存在比较大的职业缺口。当然也有其他问题,一是因为新兴,部门负责人本身也没有想好他们能干什么,不少数据PM还从事表哥的工作。二是数据产品本身可借鉴的经验不多,像APP产品,可以下载体验,总归有一个学习的过程。然而用户画像、BI、算法策略,都是其他公司的内部机密,无从参考,我就遇到不少对用户画像实现非常感兴趣的数据PM。从职业发展上看,数据分析师做数据产品经理更合适。普通的产品经理,对前端、后端的技术栈尚未熟悉,何况日新月异的数据栈。这个岗位,适合对数据特别感兴趣,但是数理天赋不高的职场人,那么以沟通、项目管理和需求规划为能力,也不错。数据产品经理,如果有数据挖掘经验,那么技术相关的书籍倒不重要,别落伍就行,更关注产品经理本身的能力,包括Axure,各类文档的编写、项目管理、需求整理等,市面上资料比较多。这里再补充两本,「数据挖掘与数据化运营实战」,没啥高深技术,但是能够了解体系的初步建立。「数据挖掘技术—应用于市场营销、销售与客户关系管理」,这本书我推荐它是纠结的,它的知识点比较丰富,业务人员也能看懂,但是翻译的实在太糟糕了……更多书籍参考其他岗位即可。数据工程师数据工程师其实更偏技术,从职业道路上看,程序员走这条路更开阔。在很多中小型的公司,一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又嗷嗷待哺。没办法,分析师只能自己撸起袖子,一个人当三个人用。兼做数据清洗+ETL+BI。经历过的大概都懂,数据分析踏上数据工程的不归路如下:每天都要从五六张表上join,那么不妨加工成一张中间表;ETL的依赖关系越来越复杂,尝试用kettle/airflow等框架搞定,弄个DAG美滋滋;运营部门的周报次次都要这几个指标,看看能否做一个自动化BI;数据量逐日增多,最近T+1的日报需要几个小时完成,研究下查询语句的优化;查询语句的优化空间也不大了,开始迁移到Hadoop/Spark分布式平台,新技术栈的学习;新平台,原有的工具也不管用了,某大牛说apache上有工具能解决这个问题,于是阅读文档;公司部署了私有化的埋点采集,数据缺失比较厉害,业务部门天天骂娘,继续埋Flume/Kafka的坑;等等…如果分析师在技术方面的灵性不错,那么技能点会往技术栈方向迁移。从最初的SQL,到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解分布式存储和NoSQL……这也是一个不错的发展方向,因为数据挖掘需要了解算法/模型,理论知识要求过高,不少硕士和博士还过来抢饭碗,自己不擅长容易遇到天花板。选择更底层的工程实现和架构,也是出路,薪资也不会低于数据挖掘/算法专家。部分归属到技术部的数据分析师,虽然Title叫数据分析(其实应该叫数据分析开发工程师),很多工作也是围绕ETL/DW/BI进行,那么这就是标准的数据工程路线。部分公司会将机器学习模型的部署和实现交给数据工程团队,这要求数据工程师熟悉sparkMLlib、Mahout此类框架。数据工程师,可以从数据分析师的SQL技能,往数据的底层收集、存储、计算、运维拓展。往后发展则是数据总监、或者数据架构师。因为数据分析出身,与纯技术栈的程序员比,思考会更贴合业务,比如指标背后的数据模型,但是技术底子的薄弱需要弥补。另外,DBA、BI这些传统的数据库从业者,也是能按这条路线进阶,或者选择数据产品经理方向。数据工程类的书籍,我看的不多,给不了建议。主要按各类名词搜索吧,什么linux、数据仓库、Hadoop、Spark、Storm、Elasticsearch等。这类岗位发展,技术更新速度比较快,所以需要保持吸收以及活用开源。最后以上四个岗位就是数据分析的发展方向,它们互有关联,如果从整个架构图来看(一篇历史旧文有更详细的描述:从零开始,构建数据化运营体系)。我们可以将其划分为数据收集—数据加工—数据运营—数据触达。数据收集负责收集各种各样的原始数据,比如用户何时何地做了什么事情。它依赖于埋点采集系统,而埋点采集,需要收集什么类型数据,往往由数据产品经理确定规范(还是看公司,数据运营和数据分析师也能负责)。收集上来的数据需要存储,往往因为高吞吐量,需要保证数据和日志的稳定性,会采用Flume+Kafka,如果有实时统计要求,也得考虑流数据。这块则是数据工程的范畴,包括原始数据的再加工,数据清洗,都是专门的数据团队完成。当获得数据后,首先第一点是讲各种明细数据加工业务指标,没有指标不成方圆,这里由数据分析师定义的。有了指标,配合各种数据产品输出,如用户画像用户标签、BI报表,这些数据产品都由数据PM统筹排期…另外一方面,数据挖掘工程师和算法专家则凭各种数据建立模型,进行实时或离线运算。模型可能会预测用户会不会购买某个商品,可能是做出一系列的推荐,可能是判断用户属于哪个类型,不一而足。更上面一层是业务相关,数据分析师会监控和分析BI上指标的波动、数据挖掘工程是通过用户反馈数据,衡量算法的优劣、数据PM按AB测试的结果改进产品。数据工程师保证系统的稳定。所有层次一环扣一环,每个岗位在其中都发挥特有的作用。数据工程偏底层技术,数据分析偏上层业务,数据挖掘和数据产品处于中间形态。不同公司虽然业务形态不一致,架构会有差异,但是职责不会偏差太大。这也是数据分析为什么会有四个方向。讲到这里,你大概对数据分析的职业规划有了明晰的了解。当然,它们彼此间并不完全独立,到后期,很多界限会变得模糊。所以规划是一方面,是否愿意执行、学习和吃透,才是职业真正的道路呀。

铁皮鼓

大数据领域主要技术方向

大数据领域的主要技术方向有:1、Hadoop大数据开发方向;2、数据挖掘、数据分析&机器学习方向;3、大数据运维&云计算方向。一、Hadoop大数据开发方向Hadoop发展到今天家族产品已经非常丰富,能够满足不同场景的大数据处理需求。作为目前主流的大数据处理技术,市场上很多公司的大数据业务都是基于Hadoop开展,而且对很多场景已经具有非常成熟的解决方案。作为开发人员掌握Hadoop及其生态内框架的开发技术,就是进入大数据领域的必经之路。Hadoop本身是用java开发的,所以对java的支持性非常好,但也可以使用其他语言。因为Hadoop是运行在Linux系统上的,所以还需要掌握Linux的知识。二、数据挖掘、数据分析和机器学习方向数据挖掘:是通过应用机器学习算法,现有数据实际上可用于预测未知数,这正是数据挖掘的奇迹与机器学习密切相关的原因。然而,任何机器学习算法的强度在很大程度上取决于大量数据集的供应。请记住,无论算法有多复杂,都不能从几行数据中做出灵感预测。大数据技术是机器学习的前提,通过使用机器学习,我们能够从现有数据集中获得有价值的见解。数据挖掘在未来的发展趋势上,在我看来,Web网路中数据挖掘的应用,特别是在互联网上建立数据挖掘服务器,与数据库服务器配合,实现数据挖掘,从而建立强大的数据挖掘引擎与数据挖掘服务市场。融合各种异构数据的挖掘技术, 加强对各种非结构化数据的开采,如对文本数据,图形数据,视频图像数据,声音数据乃至综合多媒体数据的开采。数据分析:数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。例如J.开普勒通过分析行星角位置的观测数据,找出了行星运动规律。又如,一个企业的领导人要通过市场调查,分析所得数据以判定市场动向,从而制定合适的生产及销售计划。因此数据分析有极广泛的应用范围。机器学习:如果我们的目标是分析不同类型的购物者之间的相关性,或者如果我们想要推断特定类型的购物者的特定偏好,或者甚至预测任何购物者的性别或年龄,我们将需要更多复杂的模型,我们称之为算法。机器学习可以更容易理解为为数据挖掘目的而开发的所有不同类型的算法,例如逻辑回归,决策树,协同过滤等等。三、大数据运维和云计算方向大数据运维:有一些数据需要进行维护,运维你也可以理解成维护!云计算:是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。云计算目前分为公有云和私有云。两者的区别只是提供的服务的对象不同,一个是企业内部使用,一个则是面向公众。云计算可以提升每台服务器的使用率,以此达到开源节流。