欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校

大数据的应用领域有哪些

汝鄙人也
精神
1.了解和定位客户这是大数据目前最广为人知的应用领域。很多企业热衷于社交媒体数据、浏览器日志、文本挖掘等各类数据集,通过大数据技术创建预测模型,从而更全面地了解客户以及他们的行为、喜好。利用大数据,美国零售商Target公司甚至能推测出客户何时会有Baby;电信公司可以更好地预测客户流失;沃尔玛可以更准确的预测产品销售情况;汽车保险公司能更真实的了解客户实际驾驶情况。滑雪场利用大数据来追踪和锁定客户。如果你是一名狂热的滑雪者,想象一下,你会收到最喜欢的度假胜地的邀请;或者收到定制化服务的短信提醒;或者告知你最合适的滑行线路。。。。。。同时提供互动平台(网站、手机APP)记录每天的数据——多少次滑坡,多少次翻越等等,在社交媒体上分享这些信息,与家人和朋友相互评比和竞争。除此之外,政府竞选活动也引入了大数据分析技术。一些人认为,奥巴马在2012年总统大选中获胜,归功于他们团队的大数据分析能力更加出众。2.改善医疗保健和公共卫生大数据分析的能力可以在几分钟内解码整个DNA序列,有助于我们找到新的治疗方法,更好地理解和预测疾病模式。试想一下,当来自所有智能手表等可穿戴设备的数据,都可以应用于数百万人及其各种疾病时,未来的临床试验将不再局限于小样本,而是包括所有人!苹果公司的一款健康APP ResearchKit有效将手机变成医学研究设备。通过收集用户的相关数据,可以追踪你一天走了多少步,或者提示你化疗后感觉如何,帕金森病进展如何等问题。研究人员希望这一过程变得更容易、更自动化,吸引的参与者,并提高数据的准确度。大数据技术也开始用于监测早产儿和患病婴儿的身体状况。通过记录和分析每个婴儿的每一次心跳和呼吸模式,提前24小时预测出身体感染的症状,从而及早干预,拯救那些脆弱的随时可能生命危险的婴儿。更重要的是,大数据分析有助于我们监测和预测流行性或传染性疾病的暴发时期,可以将医疗记录的数据与有些社交媒体的数据结合起来分析。比如,谷歌基于搜索流量预测流感爆发,尽管该预测模型在2014年并未奏效——因为你搜索“流感症状”并不意味着真正生病了,但是这种大数据分析的影响力越来越为人所知。3.提供个性化服务大数据不仅适用于公司和政府,也适用于我们每个人,比如从智能手表或智能手环等可穿戴设备采集的数据中获益。Jawbone的智能手环可以分析人们的卡路里消耗、活动量和睡眠质量等。Jawbone公司已经能够收集长达60年的睡眠数据,从中分析出一些独到的见解反馈给每个用户。从中受益的还有网络平台“寻找真爱”,大多数婚恋网站都使用大数据分析工具和算法为用户匹配最合适的对象。4.了解和优化业务流程大数据也越来越多地应用于优化业务流程,比如供应链或配送路径优化。通过定位和识别系统来跟踪货物或运输车辆,并根据实时交通路况数据优化运输路线。人力资源业务流程也在使用大数据进行优化。Sociometric Solutions公司通过在员工工牌里植入传感器,检测其工作场所及社交活动——员工在哪些工作场所走动,与谁交谈,甚至交流时的语气如何。美国银行在使用中发现呼叫中心表现最好的员工——他们制定了小组轮流休息制度,平均业绩提高了23%。如果在手机、钥匙、眼镜等随身物品上粘贴RFID标签,万一不小心丢失就能迅速定位它们。假想一下未来可能创造出贴在任何东西上的智能标签。它们能告诉你的不仅是物体在哪里,还可以反馈温度,湿度,运动状态等等。这将打开一个全新的大数据时代,“大数据”领域寻求共性的信息和模式,那么孕育其中的“小数据”着重关注单个产品。5.改善城市和国家建设大数据被用于改善我们城市和国家的方方面面。目前很多大城市致力于构建智慧交通。车辆、行人、道路基础设施、公共服务场所都被整合在智慧交通网络中,以提升资源运用的效率,优化城市管理和服务。加州长滩市正在使用智能水表实时检测非法用水,帮助一些房主减少80%的用水量。洛杉矶利用磁性道路传感器和交通摄像头的数据来控制交通灯信号,从而优化城市的交通流量。据统计目前已经控制了全市4500个交通灯,将交通拥堵状况减少了约16%。6.提升科学研究大数据带来的无限可能性正在改变科学研究。欧洲核子研究中心(CERN)在全球遍布了150个数据中心,有65,000个处理器,能同时分析30pb的数据量,这样的计算能力影响着很多领域的科学研究。比如政府需要的人口普查数据、自然灾害数据等,变的更容易获取和分析,从而为我们的健康和社会发展创造的价值。7.提升机械设备性能大数据使机械设备更加智能化、自动化。例如,丰田普锐斯配备了摄像头、全球定位系统以及强大的计算机和传感器,在无人干预的条件下实现自动驾驶。Xcel Energy在科罗拉多州启动了“智能电网”的首批测试,在用户家中安装智能电表,然后登录网站就可实时查看用电情况。“智能电网”还能够预测使用情况,以便电力公司为未来的基础设施需求进行规划,并防止出现电力耗尽的情况。在爱尔兰,杂货连锁店Tescos的仓库员工佩戴专用臂带,追踪货架上的商品分配,甚至预测一项任务的完成时间。8.强化安全和执法能力大数据在改善安全和执法方面得到了广泛应用。美国国家安全局(NSA)利用大数据技术,检测和防止网络攻击(挫败恐怖分子的阴谋)。警察运用大数据来抓捕罪犯,预测犯罪活动。信用卡公司使用大数据来检测欺诈交易等等。2014年2月,芝加哥警察局对大数据生成的“名单”——有可能犯罪的人员,进行通告和探访,目的是提前预防犯罪。9.提高体育运动技能如今大多数顶尖的体育赛事都采用了大数据分析技术。用于网球比赛的IBM SlamTracker工具,通过视频分析跟踪足球落点或者棒球比赛中每个球员的表现。许多优秀的运动队也在训练之外跟踪运动员的营养和睡眠情况。NFL开发了专门的应用平台,帮助所有球队根据球场上的草地状况、天气状况、以及学习期间球员的个人表现做出最佳决策,以减少球员不必要的受伤。还有一件非常酷的事情是智能瑜伽垫:嵌入在瑜伽垫中的传感器能对你的姿势进行反馈,为你的练习打分,甚至指导你在家如何练习。10.金融交易大数据在金融交易领域应用也比较广泛。大多数股票交易都是通过一定的算法模型进行决策的,如今这些算法的输入会考虑来自社交媒体、新闻网络的数据,以便更全面的做出买卖决策。同时根据客户的需求和愿望,这些算法模型也会随着市场的变化而变化。精彩:14_spark体系之分布式计算课程Spark 集群搭建+S

大数据应用的领域主要有哪些

苦菜花
其风域然
1.可用于课堂教学中,传统课堂哪个孩子开小差没人知道,而在这种“智慧课堂”上,哪个孩子不跟着思考、不参与答题,一目了然。“每个孩子的答题数据,都会记录在教学云平台上,并自动生成错题集,推送给家长。2.“明厨亮灶”校级平台显示,食堂安装高清摄像头,从配菜到烹饪,每一道环节都在餐厅大屏幕上实时展示。食堂操作间设有二维码,通过扫描可查看食堂质量安全记录、留样记录、出库单等。实现供应商商品上架、出库、审核、配送信息化和食品溯源、追责管理智能化。3.学生早晨上学是从哪个校门进的,中午吃了什么,选了那些兴趣课,有没有去图书馆,他喜欢看哪些课外书?这些情况,大数据都可以收集到,并制作成学生电子档案,家长登录学生电子档案的个人门户网站,孩子的成长信息更一览无余。

大数据的国内外研究现状及发展动态分析

娓娓动听
一多
去百度文库,查看完整内容>内容来自用户:沈关锋产生地背景与意义上世纪年代到年代早期,企业在大型机上部署财务、银行等关键应用系统,存储介质包括磁盘、磁带、光盘等.尽管当时人们称其为大数据,但以今日地数据量来看,这些数据无疑是非常有限地.随着地出现和应用增多,企业内部出现了很多以公文档为主要形式地数据,包括、文档,以及后来出现地图片、图像、影像和音频等.此时企业内部生产数据地已不仅是企业地财务人员,还包括大量地办公人员,这极大地促进了数据量地增长.互联网地兴起则促成了数据量地第三次大规模增长,在互联网地时代,几乎全民都在制造数据.而与此同时,数据地形式也极其丰富,既有社交网络、多媒体等应用所主动产生地数据,也有搜索引擎、网页浏览等被动行为过程中被记录、搜集地数据.时至今日,随着移动互联网、物联网、云计算应用地进一步丰富,数据已呈指数级地增长,企业所处理地数据已经达到级,而全球每年所产生地数据量更是到了惊人地级.在数据地这种爆炸式增长地背景下,“大数据”地概念逐渐在科技界、学术界、产业界引起热议.在大数据时代,我们分析地数据因为“大”,摆脱了传统对随机采样地依赖,而是面对全体数据;因为所有信息都是“数”,可以不再纠结具体数据地精确度,而是坦然面对信息地混杂;信息之国内外研究进展国外除在大数据地概念上地研究外,重点放在技术研究

大数据发展前景以及最新的研究成果有哪些?

天狗
人处一焉
  参考前瞻产业研究院《中国大数据产业发展前景与投资战略规划分析报告》显示,中国目前的大数据应用环境和技术相对于美国而言,在整体技术水平、应用环境、国民意识、商业环境、技术厂商、技术平台上面相差超过5年左右。在大数据应用的国家战略层面落后的也较多。  目前了解到的信息是上海政府计划建设大数据产业园,通过政府自身投资来建立大数据平台,吸引中小企业将信息系统及数据放到政府主导的数据平台上,政府将利用此平台来挖掘数据信息,提供数据信息报告。另外一个大数据应用是地方政府请一些大数据公司来开发舆情检测系统,及时了解社会舆论。无论是大数据产业园还是舆情监控。我个人认为没有抓住大数据优势的核心,大数据产业园的管理机制和创新动力不足,无法发挥大数据计算的优势,反而浪费了大量的投资,效率较低。舆情监控本身就无法发挥大数据的商业应用优势,反而阻碍大数据产业的商业应用。我们应该提供大数据产业优惠政策,在资金、场地、税收、科研方面提供外部支持,让企业自身投入到大数据产业建设之中,从企业自身商业需求出发,投入资金来发展大数据产业。  最后总结一下,大数据时代将会给人类社会带来巨大变化,它是一个好的工具,就像计算机一样,帮助人们提升社会生产效率,了解事物真相,认识客观规律。重要的大数据可以帮助政府和企业进行科学决策,降低决策风险,加快进入智慧社会。

大数据应用实例分析

永井
心愿
去百度文库,查看完整内容>内容来自用户:夜荀_电信运营商的阳关大道09012208黄文婷摘要:随着全球数据化、网络宽带化,基本的数据量越来越大,由此我们进入了大数据时代。本文探讨了大数据内涵与意义,从电信行业这一大数据应用实例进行分析,介绍了大数据在电信行业的应用、必要性及相关措施。关键词:大数据电信应用正文:1、大数据的内涵与意义(一)大数据的意义大数据和云计算一样,近两年来越来越多的受到人们的关注。那么什么是大数据呢?大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)对于“大数据”(Big data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。(2)大数据的特性大数据有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、veracity(真实性)。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到此外,大数据的潮流虽然依赖于信息通信技术的成熟,但它对整个世界的影响绝不仅限于技术层次。它借助信息技术的创新与发展,及数据的全面感知、收集、分析

大数据的应用案例以及未来发展趋势

思虑恂达
不可得也
赶超发达国家的重要机遇 半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度,不仅使世界充斥着比以往的信息,而且其增长速度也在加快。信息爆炸的学科如天文学和基因学,创造出来大数据这个概念,如今,这个概念几乎应用到了所有人类智力与发展的领域中。21世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器、智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据,大数据时代已经到来。 当前全球和我国大数据都呈现了井喷式爆发性增长,大数据已经渗透到各个行业和业务职能领域,成为重要的生产因素,大数据的演进与生产力的提高有着直接的关系。其发展特点,一是数据量呈现指数级增长。二是不同行业的大数据内容和开发应用特点各有不同,如证券、投资服务以及银行等金融服务领域拥有最高的平均数字化数据存储量,通信和媒体公司、公共事业公司以及政府等组织也有规模显著的数字化数据存储,这些行业更加具有通过大数据来创造价值的潜力。三是可以预见到大数据高速增长的现有趋势将继续推动数据增长,例如在各部门和地区之间,企业正在加快收集数据的步伐,推动了传统的事务数据库的增长;医疗卫生等面向消费者的行业中,多媒体的广泛使用刺激了大数据的增长;社交媒体的广泛普及以及物联网中应用的不断创新都进一步推动了大数据不断增长……这些相互交叉的动力刺激了数据的增长,并将继续推动数据池的迅速扩张。 发展大数据及其相关服务业将成为新兴经济体特别是我国在战略性新兴产业领域发挥后发优势赶超发达国家的重要机遇。只要条件具备,发展中经济体能够利用大数据发挥巨大的潜力。例如,亚洲地区移动手机用户最多,终端设备最多,其中中国设备数量最多,个人位置数据在亚洲已经领先。此外,在IT资产方面,尽管一些新兴市场组织落后于发达市场,但发展中经济体可以用最新技术跳跃式前进。大数据的应用不仅仅是商务,通过用户行为分析实现精准管理、科学决策和人性化服务是大数据的典型应用,大数据在各行各业特别是公共服务领域具有广阔的应用前景,包括消费行业、金融服务、食品安全、医疗卫生、军事、交通环保、电子商务、气象等。发展大数据产业机遇可贵潜力巨大。从经济和产业发展维度看大数据及相关产业发展的潜力,我国独特的位势和经济社会高速稳定发展,给大数据及其应用带来了巨大的发展空间。大数据在我国各领域和不同行业的应用潜力巨大、机遇重大。大数据的核心技术进展和大数据应用有可能带来我国新兴战略性产业发展的新机遇。 信息服务业发展的重要推力 研究表明,大数据是继传统IT之后下一个提高生产率的技术前沿和信息服务业发展的重要推动力。大数据的使用将成为未来提高竞争力、生产力、创新能力以及创造消费者盈余的关键要素。 例如医疗卫生行业,能够利用大数据避免过度治疗、减少错误治疗和重复治疗,从而降低系统成本、提高工作效率,改进和提升治疗质量;公共管理领域,能够利用大数据有效推动税收工作开展,提高教育部门和就业部门的服务效率;零售业领域,通过在供应链和业务方面使用大数据,能够改善和提高整个行业的效率;市场和营销领域,能够利用大数据帮助消费者在更合理的价格范围内找到更合适的产品以满足自身的需求,提高附加值。数据已经成为可以与物质资产和人力资产相提并论的重要的生产要素,伴随着信息化发展,企业将收集的信息,从而带来数据呈现指数级的增长。大数据在同时为商业和消费者创造价值方面有巨大的发展潜力。 大数据应用能够发挥重要的经济作用,不但有利于私人商业活动,更有利于国民经济和公民。数据可以为世界经济创造重要价值,提高企业和公共部门的生产率与竞争力,并为消费者创造大量的经济剩余。例如,能够富有创造性而有效地利用大数据来提高效率和质量。麦卡锡公司研究报告指出,预计美国医疗行业每年通过数据获得的潜在价值可超过3000亿美元,能够使得美国医疗卫生支出降低超过8%,充分利用大数据的零售商有可能将其经营利润提高60%以上。通过利用大数据实现政府行政管理方面的运作效率提高。估计欧洲发达经济体可以节省开支超过1000亿欧元,其中尚不包括可以用来减少欺诈、错误以及税差的影响作用。可以预见的是,随着人们存储、汇聚和组合数据然后利用其结果进行深入分析的能力超过以往,随着越来越尖端技术的软件与不断提高的计算能力相结合,从数据中提取洞见的能力也在显著提高。 大数据及其开发利用能够催生新的产业形态,拓展成为战略性新兴产业的重要组成部分。大数据的生产、整合、开发利用具有广泛的高附加值,可以形成和应用于各行业的关键发现,大数据的有效利用可以创造巨大的潜在价值,许多行业和承担业务职能的组织可以利用大数据提高人力、物力资源的分配和协调能力,减少浪费,增加透明度,并促进新想法和新见解的产生。其价值一是提高透明度,让利益相关方能够更加容易地及时获取信息,例如在公安部门,让原本相互分离的部门之间更加容易地获取相关数据,就可大大降低搜索和处理时间;在制造业,整合来自研发、工程和制造部门的数据以便实现并行工程,可以显著缩短产品上市时间并提高质量。二是可以通过实验来发现需求、暴露可变因素并提高业绩。随着组织创造并存储数字形式的交易数据,并以实时或接近实时的方式收集准确而详细的绩效数据,组织能够通过安排对比实验,运用数据分析获取更好的决策,例如在线零售商,通过将流量和销售结合的试验论证决定价格调整和促销活动的制定。三是更加精准地组织市场,根据客户需求细分人群。利用大数据使组织能够对人群进行非常具体的细分,以便精确地定制产品和服务以满足用户需求。例如在公共部门如公共劳动力机构,利用大数据为不同的求职者提供工作培训服务,确保采用最有效和最高效的干预措施使不同的人重返工作岗位。四是可以协助决策者更加科学地进行决策。大数据的自动处理能够更好地为决策者提供更加精准恰当的决策支持,通过对大数据的自动处理来替换或支持人为决策。有些组织已经在通过分析来自客户、雇员甚至嵌入产品中的传感器的整个数据集而做出更有效的决策。五是能够创新商业模式、产品和服务。例如在医疗保健领域,通过分析病人的临床和行为数据已经创造了瞄准最适当群体的预防保健项目。例如互联网公司收集大量的在线行为数据,创新速度非常快。 应组织实施大数据产业专项 发展大数据及其相关服务业具有重要意义,有望使各个行业产生收益。随着我国经济和社会信息化的高速发展,不仅信息产业自身获取了巨大的数据池,各个行业都存在利用大数据获取价值的潜力。大数据促使信息化建设模式大转变,结构化数据向非结构化数据演进,使得未来IT投资重点不再是建系统为核心,而是围绕大数据为核心。政府和企业决策者应对大数据发展研究制定发展战略和策略给予高度重视。 大数据真正的问题是大数据应用,让大数据更有意义。目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心。非结构化海量信息的智能化处理包括自然语言理解、多媒体内容理解、机器学习等。例如2012年3月29日白宫发布美国政府的大数据计划:通过提高从大型复杂的数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。 由此,我们提出组织实施大数据产业专项的初步设想。一是围绕拓展新兴信息服务业态,组织实施以大数据示范、加工、处理、整合和深加工的信息资源与内容服务业示范工程,面向重点行业和重点民生领域包括金融证券、医疗卫生、税务海关、交通运输、社会保障、电子商务等领域,开展大数据重大应用示范,提升基于大数据的公共服务能力;二是加快推动北斗导航核心技术研发和产业化,推动北斗导航与移动通信、地理信息、卫星遥感、移动互联网等融合发展,支持位置信息服务市场拓展,完善北斗导航基础设施,推进服务模式和产品创新,在重点区域和领域开展示范应用;三是大力发展地理信息产业,拓宽地理信息服务市场,推进大数据技术和服务模式融合创新,支持大数据服务创新和商业模式创新;四是组织实施基于大数据的信息内容加工服务业典型示范工程,包括关键技术产品产业化和大数据生产、转换、加工、投送平台及专用工具的产业化项目,为丰富信息消费内容产品供给提供支撑;五是组织实施自主可控的大数据关键技术产品产业化项目,主要包括商业智能、数据仓库、数据集市、元数据、可视化技术等。

大数据的国内外研究现状及发展动态分析

无常
缉毒战
去百度文库,查看完整内容>内容来自用户:菊香秋大数据的国内外研究现状及发展动态分析大数据的概念产生的背景与意义上世纪60年代到80年代早期,企业在大型机上部署财务、银行等关键应用系统,存储介质包括磁盘、磁带、光盘等。尽管当时人们称其为大数据,但以今日的数据量来看,这些数据无疑是非常有限的。随着PC的出现和应用增多,企业内部出现了很多以公文档为主要形式的数据,包括Word、Excel文档,以及后来出现的图片、图像、影像和音频等。此时企业内部生产数据的已不仅是企业的财务人员,还包括大量的办公人员,这极大地促进了数据量的增长。互联网的兴起则促成了数据量的第三次大规模增长,在互联网的时代,几乎全民都在制造数据。而与此同时,数据的形式也极其丰富,既有社交网络、多媒体等应用所主动产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记录、搜集的数据。时至今日,随着移动互联网、物联网、云计算应用的进一步丰富,数据已呈指数级的增长,企业所处理的数据已经达到PB级,而全球每年所产生的数据量更是到了惊人的ZB级。在数据的这种爆炸式增长的背景下,“大数据”的概念逐渐在科技界、学术界、产业界引起热议。在大数据时代,我们分析的数据因为“大”,摆脱了传统对随机采样的依赖,而是面对全体数据;因为所有信息都是“数”,可以不再纠结具体数据的精确度,而是坦然面对信息的混杂;信息之“大”之“杂”,让我们分析的“据”也由传统的因果关系变为相关关系。国内外研究进展国外除在大数据的

大数据是什么,大数据能做什么

数术
道德于此
大数据能做如下:一、对信息的理解。你发的每一张图片、每一个新闻、每一个广告,这些都是信息,你对这个信息的理解是大数据重要的领域。二、用户的理解。每个人的基本特征,你的潜在的特征,每个用户上网的习惯等等,这些都是对用户的理解。三、关系。关系才是我们的核心,信息与信息之间的关系,一条微博和另外一条微博之间的关系,一个广告和另外一个广告的关系。一条微博和一个视频之间的关系,这些在我们肉眼去看的时候是相对简单的。大数据专业术语:1、apache软件基金会(asf)提供了许多大数据的开源项目,目前有350多个项目。是专门为支持开源软件项目而办的一个非盈利性组织。在它所支持的apache项目与子项目中,所发行的软件产品都遵循apache许可证。2、apachemahoutmahout提供了一个用于机器学习和数据挖掘的预制算法库,也是创建算法的环境。换句话说,是一个机器学习的天堂环境3、apacheoozie在任何编程环境中,需要一些工作流程系统来以预定义的方式和定义的依赖关系来安排和运行工作。oozie提供的大数据工作以apachepig,maprece和hive等语言编写。

大数据时代

魂魄
本垒打
大数据是什么?是一种运营模式,是一种能力,还是一种技术,或是一种数据集合的统称?今天我们所说的“大数据”和过去传统意义上的“数据”的区别又在哪里?大数据的来源又有哪些?等等。当然,我不是专家学者,我无法给出一个权威的,让所有人信服的定义,以下所谈只是我根据自己的理解进行小结归纳,只求表达出我个人的理解,并不求全面权威。先从“大数据”与“数据”的区别说起吧,过去我们说的“数据”很大程度上是指“数字”,如我们所说的客户量,业务量,营业收入额,利润额等等,都是一个个数字或者是可以进行编码的简单文本,这些数据分析起来相对简单,过去传统的数据解决方案(如数据库或商业智能技术)就能轻松应对;而今天我们所说的“大数据”则不单纯指“数字”,可能还包括“文本,图片,音频,视频……”等多种格式,其涵括的内容十分丰富,如我们的博客,微博,轻博客,我们的音频视频分享,我们的通话录音,我们位置信息,我们的点评信息,我们的交易信息,互动信息等等,包罗万象。用正规的语句来概括就是,“数据”是结构化的,而“大数据”则包括了“结构化数据”“半结构化数据”和“非结构化数据”。关于“结构化”“半结构化”“非结构化”可能从字面上比较难理解,在此我试着用我的语言看能否形象点地表达出来:由于数据是结构化的,数据分析可以遵循一定现有规律的,如通过简单的线性相关,数据分析可以大致预测下个月的营业收入额;而大数据是半结构化和非结构化的,其在分析过程中遵循的规律则是未知的,它通过综合方方面面的信息进行模拟,它以分析形式评估证据,假设应答结果,并计算每种可能性的可信度,通过大数据分析我们可以准确找到下一个市场热点。 基于此,或许我们可以给“大数据”这样一个定义,“大数据”指的是收集和分析大量信息的能力,而这些信息涉及到人类生活的方方面面,目的在于从复杂的数据里找到过去不容易昭示的规律。相比“数据”,“大数据”有两个明显的特征:第一,上文已经提到,数据的属性是包括结构化、非结构化和半结构化数据;第二,数据之间频繁产生交互,大规模进行数据分析,并实时与业务结合进行数据挖掘。解决了大数据是什么,接下来还有一个问题,大数据的来源有哪些?或者这个问题这样来表达会更清晰“大数据的数据来源有哪些?”对于企业而言,大数据的数据来源主要有两部分,一部分来自于企业内部自身的信息系统中产生的运营数据,这些数据大多是标准化、结构化的。(若继续细化,企业内部信息系统又可分两类,一类是“基干类系统”,用来提高人事、财会处理、接发订单等日常业务的效率;另一类是“信息类系统”,用于支持经营战略、开展市场分析、开拓客户等。)传统的商业智能系统中所用到的数据基本上数据该部分。而另外一部分则来自于外部,包括广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据由源于 Facebook、Twitter、LinkedIn 及其它来源的社交媒体数据构成,其产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。具体包括了:如,呼叫详细记录、设备和传感器信息、GPS 和地理定位映射数据、通过管理文件传输协议传送的海量图像文件、Web 文本和点击流数据、科学信息、电子邮件等等。由于来源不同,类型不同的数据透视的是同一个事物的不同的方面,以消费客户为例,消费记录信息能透视客户的消费能力,消费频率,消费兴趣点等,渠道信息能透视客户的渠道偏好,消费支付信息能透视客户的支付渠道情况,还有很多,如,客户会否在社交网站上分享消费情况,消费前后有否在搜索引擎上搜索过相关的关键词等等,这些信息(或说数据)从不同的方面表达了客户的消费过程的方方面面。因此,一般来说,企业用以分析的数据来源越广越全面,其分析的结果就越立体,越接近于真实。因此,大数据分析意味着企业能够从不同来源的数据中获取新的洞察力,并将其与企业业务体系的各个细节相融合,以助力企业在创新或者市场拓展上有所突破。针对“数据量”这个话题,亚马逊CTO Vogels曾经说过,“在运用大数据时,你会发现数据越大,结果越好。为什么有的企业在商业上不断犯错?那是因为他们没有足够的数据对运营和决策提供支持。一旦进入大数据的世界,企业的手中将握有无限可能。”可以预料,在不远的未来,企业如何通过抓住用户获取源源不断的数据资产将会是一个新的兵家必争之地。在这个层面上,Facebook、Twitter、Google、Amazon,包括电信运营商等领先企业具有无可比拟的优势。在大数据的领域里是否数据量越大越好?很多时候我们写文章,并不是想要去重复某一个众所周知的事实,而的是想从另外一个角度试图去质疑那些已成事实的事实,并不是想要去推翻,而只是去看这个事实是否存在另外的可能性,虽然很多时候我的那些质疑会漏洞百出,并显得幼稚可笑,但我觉得一个事物的健康发展需要不同的声音,而这正是我们写文章的意义所在。所以,我现在问题是,在大数据的领域里是否数据量越大越好?对于这个问题,我觉得应该分两个层面来看,第一个层面是,对大数据这个整体而言,数据肯定是越大越好的,多元的数据能让不同行业,不同组织都可以从大数据中寻找到解决问题的方法,也是基于此,现在越来越多的企业组织通过不同的终端、应用或者其他手段去疯狂地收集多元的数据,大数据让人们能有足够的能力和视野将地球(包括地球上的一切)作为一个整体去看待,这是在从前无法想象的。第二个层面是,对于大数据的具体应用而言,数据量是否越大越好,我却有不同的看法。我的理解是,在大数据的实际应用中你用以分析的数据量越大,你能得到的东西就越多,而至于得到的那些东西是否是你所需要的,或者对你是否有价值的,没有人能保证。就如同树林里有100条路,每条路上都有一些你觉得有意思的东西,如果你有足够的时间,你可以走遍这100条路,收获很多有意思的小东西,但不是每一条路都会让你得到真正有价值的东西。经常做数据分析的朋友应该会有同感,在分析的过程中你会发现不同的数据通过不同的组合导入不同的分析模型会得到很多不同的结果,有时候会有一些很新鲜的结果被发现,这会让你很惊喜,但大部分这些新鲜的结果最后只会出现在你的微博里,而不会出现在正式的分析报告中,因为分析报告是为解决某一具体问题而存在的,旁枝末节太多会显得臃肿且容易混淆。所以,我认为,在大数据的具体应用面前,我们先要做的是把“大数据”这个概念忘掉,我们必须弄清楚到底想从大数据中得到什么,然后带着目的去收集有用的数据,输入至分析模型中,直接导向我们想要的结果。否则你将花费大量时间、资源成本去获取数据,分析数据。我们需要大数据应用是能够帮助解决问题的行为洞察,而不是试图研究每一条能够得到的信息。不得不说,大数据的世界太魔幻了,里面的诱惑很多,如果你不是带着明确的目标去应用,你很有可能被陷入在五光十色的诱惑中无法自拔。即使你走进了一座金山,最后你能带走的最多也只是你能提动的一小口袋。另外,这同时也揭示,为了避免应用者困在“大数据的金山”,大数据必须往下细化,针对不同行业不同领域的特定问题制定不同的解决工具,未来大数据将会遵循消费化模式,核心基础设施将作为服务或应用程序来提供。大数据,云计算,看起来都是非常高大上的东西,还是切合点实际,先落地再说吧。我们公司数据量比较大,用的是国产的FineBI软件,还不错!