摘要:大数据时代,数据已经成为最大的大宗商品,也是企业最有价值的资源。如何挖掘供应链的大数据资源,成为企业能否成功利用和获取大数据能量的关键。CSCMP的调查报告揭示了企业正采取的策略,为中国企业实施供应链大数据分析提供了有价值的借鉴。大数据时代,数据已经成为最大的大宗商品,也是企业最有价值的资源。企业如何挖掘供应链的大数据资源,成为能否成功利用和获取大数据能量的关键。CSCMP的调查报告,反映了美国企业在供应链数据挖掘方面所处的现状、面临的困惑和采取的策略,为中国企业实施供应链大数据分析提供了有价值的借鉴。原文标题:《供应链中的大数据:如何应对数据浪潮?》,以下为编译的内容,本文有删节。供应链中的数据量正呈指数级增长。企业也在付出努力,以期对可获得的信息进行更有效的利用。CSCMP的调查报告揭示了企业正采取的策略,以驾驭大数据的能量。技术的应用使得供应链组织可以从各种来源收集大量信息。供应链各网络节点、多元化的零售渠道、工业物联网,还有很多很多信息源,产生着数以十亿计的数据信息。收集大量信息的目的,当然是对这些信息进行分析,以期获得创新和改进的机会。但是很少有公司能真正从它们积累的供应链数据中获得可持续价值。相反,他们正为如何确保数据的质量、如何分析数据、以及如何把从数据中学到的东西应用于实践而苦苦挣扎。供应链管理专业协会(CSCMP)的《供应链季刊》联合有关单位进行了一次大调查。参加调研组织的单位包括亚利桑那州立大学、科罗拉多州立大学、竞争洞察力公司(Competitive Insights LLC)、哈灵顿咨询公司(Lharrington Group LLC)。本文给出了调查分析的基本结论。报告涉及的主要方面,包括企业对当前自身数据分析的满意度水平;企业数据挖掘和技术分析所采用的方法;管理日益庞大的供应链数据所面临的挑战和将来的收益;企业供应链数据分析的现状,以及近期内数据分析投资的重点。企业对数据的满意度并不一致调查于2017年6月进行,该调查通过电子邮件邀请供应链管理专业协会的《供应链季刊》的读者和竞争洞察力公司(Competitive Insights)时事通讯的用户参加调研。共收回126个完整的、可用的问卷,作为统计分析样本。毫无疑问,大多数公司正在收集的数据量显着增加。当被问及过去三年来供应链数据的增长速度时,36%的人认为呈现中高速态势;38%的人认为高、或是非常高的。但是,情况往往如此,数量不一定等同于质量。供应链经理对他们目前运行供应链的数据满意度如何?大部分受访者表示对供应链数据的可得性、可用性、完整性以及一致性至少是满意的。然而,正向的结论(中等偏高,偏高或非常高的满意度)并不显著高于负面的数值(见图1)。图1:企业数据满意度有趣的是,只有极少数受访者表示对所有四个数据指标都非常满意,包括数据可得性(3%)、可用性(2%)、完整性(6%)和一致性(4%)。竞争洞察力公司的首席执行官理查德夏普(Richard Sharpe)表示:“数据相当于‘房子’的地基。调查结果清楚地表明,这个地基上存在着一些裂隙——企业在数据汇集能力、整合能力、对数据的信心、是否相信数据具有一致性等方面,都存在着分歧。为了利用大数据分析的优势,我们必须在这四个方面都做得更好。”如果企业只对他们获得的部分数据感到部分满意,那么下一个逻辑问题就是:他们目前正在使用什么软件解决方案来收集这些数据?显而易见,目前最常用的解决方案不是进阶分析法,也不是商业智能,更不是像仓库管理系统那样的可操点应用程序。虽然,市场上有很多复杂的分析软件,但目前用于管理供应链数据使用最广泛的工具却仍然是Excel电子表格(图2)。图2:分析技术类别尽管公司依赖电子表格,但用户却认为它不是一个理想的数据管理工具。亚利桑那州立大学商学院的ON半导体公司荣誉教授戴尔罗杰斯(Dale Rogers)说:“我们的调查表明,在可用性、完整性和数据一致性方面,用户对Excel都不满意。Excel表格的问题在于每个人都建立他们自己的电子表格,这就导致了一致性的缺失,各部门之间不能实时共享,使得不同部门之间也很难完全相信已有的数据去做出跨部门的重大决策”。调查还发现,大型公司毫无例外地大都采用ERP系统来管理企业的财务。但对于供应链专业人士来说,ERP有不足之处。科罗拉多州立大学供应链管理专业的助理教授扎克罗杰斯(Zac Rogers)指出:“供应链的专业人员不太喜欢ERP。很多人认为从ERP系统中得出的数据对于实现他们目的而言并不是非常有用。”他们认为ERP系统过于僵化。他们也失去了用于支持供应链操作点解决方案所使用的粒度操作数据。就像对电子表格一样,他们并不信任ERP数据——至少能像他们所需要的那样管理他们的供应链。当谈到大数据分析时,供应链机构通常依赖以下五种基本工具:·描述性工具—告诉你发生了什么·诊断性工具—告诉你发生的原因·预测性工具—告诉你即将发生什么·规范性工具—告诉你应该/可以做什么·认知性工具—利用机器学习,以此来告诉你应该做什么调查结果显示,到目前为止,这五种工具中最广泛使用的是描述性分析工具。61%的调查对象表示使用这类分析工具。此外,其他四种类型分析工具的使用频率远远低于描述性分析工具。根据调查,公司定期、频繁或大量使用以上基本工具的频率排序如下:诊断性工具42%,规范性工具36%,预测性工具31%,认知性工具18%(图3)。图3:分析工具类别对于仅限于使用描述性分析工具的供应链企业来说,不太可能在供应链数据应用方面取得很大进展。夏普认为,“采用描述性数据工具是绝对有必要的,但是它们仅仅有助于告诉你已经发生了什么,为了获得更深入的结论,企业需要采用其它类型的分析工具。”然而,引入更高级的分析工具需要时间。从这一点来看,企业究竟在供应链大数据分析已经走了多远呢?在技术应用及获取回报方面已经有多成熟的应用呢?答案是“并没有走太远”。调查给出的数据已经说明了这一点:28%的公司处于“研发”阶段,正在开始采用一个或多个大数据分析工具。24%的公司处于“早期”阶段,正在进行概念验证测试以确定采用数据分析的收益和可能产生的负面影响。20%的公司没有进行供应链大数据分析。只有2%的公司认为自己在大数据应用方面是成熟的,也就是说,已经处于应用和收益的转型阶段。关于供应链大数据分析成熟度的问题,还有一个有趣的发现:不仅不同的产业成熟度不同,在是否计划采用大数据分析方面也存在差异。在等级为1-6的成熟度模型中,没有一种产业的成熟度能达到6。事实上,没有一个产业能达到最高的两个级别——“领先级”和“转型级”。技术型产业成熟度水平最高是3.7,尚未达到“比较领先”的程度,而成熟度最低的生命科学类的企业,能进入“导入期”的成熟度只有2.3。机械制造业成熟度略稍高于生命科学,第三方物流公司(3PLs)和零售商的成熟度则介于“早期”和“研发期”之间,(其它行业没有显著的成熟度数值)。在对这些排名进行分析时,夏普指出,有些产业对供应链数据分析价值的认知度较高,有些产业则对于走出传统的窠臼没什么兴趣。比如说,尽管生命科学(也包括保健和制药)类的公司成熟度等级最低,但是这一行业对投资大数据分析给了非常高或比较高的优先级。夏普说,“他们知道得迅速行动起来,因为这个行业更新换代很快,所以这类企业正在投资于供应链数据分析。”阻碍与回报如前所述,大多数公司仍处于供应链大数据分析的早期阶段。对于很多公司来说,并不是他们没有尝试。参与调查的企业给出了一系列的制约因素。有些是技术的问题,比如分散的数据整合或者数据仓库建设的问题,已经成为一个比较大或者非常大的制约因素,47%的受访者反应了这个问题。其他受访者反应的制约因素包括:需要对软件和硬件进行投资,用户对分析工具感到难以驾驭,安全性及其它风险(图4)。图4:实施大数据分析的制约因素大量的受访者认为比较大、或者非常大的其它制约因素包括商务管理的问题,而不是技术问题。其中之一是获取人才和专业知识(41%)的难度,这可能与受访者认为分析工具难以驾驭密切相关。另一个是管理层的承诺和支持(44%)。同时,投资回报或价值的不确定性也是主要障碍,与前一种制约因素的比例相当(43%)。罗杰斯认为:供应链大数据分析这样的事情,通常是从上到下大幅度推动的事,但往往实施大数据分析计划是由中层的实际使用者提出来的,然后再向高层推销这个观点。我们已经发现,将大数据分析的概念推销给高层十分困难,他们根本不懂为什么需要投入时间和金钱搞这些东西。已经实施了大数据分析的企业认为,在充分获取供应链数据价值的过程中,他们遇到了一些障碍。只有不到三分之二(64%)的人在某种程度上同意(略微同意、同意或强烈同意),传统体系中的数据捕获能力的不足,将会阻碍他们利用供应链数据价值的能力。罗杰斯说:“我认为人人都期望能从供应链大数据分析中获益,但他们都没有看清路径,主要的问题来自于传统公司体系的制约,以及应对ERP系统的难度。”在很多情况下,供应链大数据分析的制约因素源于整合外部供应商数据以及企业内部部门数据的困难,难以确保数据的质量和一致性。例如,67%的人认为,打破内部数据分割、获得当前没有整合或者分享的数据的困难,是制约他们从供应链和数据分析中获取价值的障碍。而71%的人认为,保证数据质量的一致性和完整性的困难也成为获取数据价值的制约因素。尽管面临着这些挑战,受访者仍认为他们的付出已经取得了某些回报。当问及他们公司在供应链大数据分析获得多大程度的有利影响时,他们的回答在八个关键的方面有很大差异(图5)。图5:大数据分析的正面影响排在第一位的是盈利能力:89%的受访者认为,大数据分析对企业盈利能力已经至少产生了某些正面影响, 44%的受访者则反应大数据分析对企业利润产生了显著或者非常显著的影响。6%的受访者甚至认为,大数据分析对他们公司的盈利能力产生了巨大的影响。在大数据分析的正面影响中,对客户服务和库存管理的正面影响也排在前面,分别达到47%和42%。迄今为止,大数据分析正面影响较小的领域包括供应链风险和韧性管理、端到端的总供应链协作和供应链总服务成本的影响。研究发现,已经实现的收益与受访者所使用的分析工具类型之间具有很强的相关性。扎克罗杰斯说:“我们发现,采用描述性工具的那些企业,其结果大都是负面的。这意味着它没有起太大的作用。"相反的是,采用规范性工具和可诊断性分析工具的企业,其结果都是正向的。例如,使用更高级应用程序的公司反映,他们在供应链可见度、规划模型、风险管理和客户服务方面获得很多收益。调查同时发现,预测性分析与端到端的供应链信息传递、供应链可视性、风险管理、需求计划以及供应链服务总成本等方面的收益,存在非常强的正相关性。未来的计划和优先事项最后一组问题是向受访者询问了他们未来的计划和优先事项。例如,调查问及公司在未来十二个月内在大数据分析项目方面的重点。对于很多公司来说,打好基础、正确地掌握数据挖掘的基本原则有高或者很高的优先级。这其中包括提高数据的准确性(47%)、数据的可访问性(46%)、数据的可用性(45%)和数据的一致性(43%)。尽管描述性分析工具对收益的影响不大,然而超过1/3的受访者计划进行适度的投资,23%的受访者计划对该技术进行大规模或者非常大规模的投资。夏普说:“这并不是一件坏事,但是描述性分析工具只能提供‘后视镜中的画面’,对于受访者来说,更重要的问题是,我们要去做些什么呢?”受访者给出了答案:对于可诊断性分析工具, 29%的受访者计划进行适度投资,22%的受访者计划进行大规模或非常大规模的投资;对于规范性分析工具,26%的受访者计划适度投资,25%的受访者计划进行大规模或非常大规模投资(图6)。图6:近期投资重点不管他们计划投资什么样的大数据工具,绝大多数受访者表示,他们希望在未来的12个月内,在图6所示的所有领域至少可以得到回报。虽然很少有人预见到供应链对所有这些领域的变革性影响——供应链变革对盈利能力的影响度百分比低至7%,到对端到端供应链合作的影响度高达13%——受访者显然相信,他们的数据分析工作将在短期内得到回报。超过一半的受访者表示,他们预计供应链数据分析工具的应用将在如下领域带来相当显著、显著或非常显著的有利影响:按降序排列分别是,客户服务(62%),盈利能力(60%),成本效益(59%),库存管理(59%),风险和弹性管理(52%),需求计划 52%)和端到端供应链协作(51%)。克服阻碍,以求成功戴尔罗杰斯认为,这份调查有价值的结论之一,就是供应链组织需要投入更多资源,用以克服大数据分析中存在的技术上、结构上以及企业管理上的障碍。他说:“人们确实需要大数据分析,但问题和障碍很多,实在是不知该如何着手实施。”如前所述,企业实施供应链大数据分析的最大障碍之一,在于不易获得前后统一、无冗余、可信度高的合适数据。夏普说:“那是个多因导致的复杂问题,但一个重要方面,首先是如何准确判定需要什么样的数据,然后迅速建立数据处理流程,这其中就包括甄选出能有效运用数据的项目专家”。要获得大数据分析的支持和投资,关键在于能清楚地理解大数据分析的目标及其意义。这就意味着供应链组织必须令人信服地向公司领导层阐明数据分析的商业利益。夏普说:“你必须最终要展示出在供应链数据分析中的所做所为,是为了让企业更成功、获取更多利润。”文章来源:《供应链季刊》CSCMP代表处供稿甘凯龙等译,王国文校对整理。
获取《2019大数据行业研究报告》完整版,请关注gongzhonghao:vrsina,后台回复“综合报告3”,该报告编号为20bg0037。日前,MobData发布最新《2019大数据行业研究报告》。报告显示,在不确定的经济形势下,信息支出成为企业的刚性需求。信息支出是刚性需求,有些支出能省则省,有些支出却恰好转变为了刚性需求。企业增加信息支出,对外部局势洞若观火,有助于其避风险、保收益。信息支出的市场规模,根据普华永道报告,行业信息支出预计将以5.3%的年复合增长率增长,在2020年达到13.6亿美元的市场规模。!
前言近年来,随着人们的数据意识和数据素养不断提升,商业智能和数据分析领域迎来了快速发展期,据Gartner商业智能报告统计,到2020年全球的商业智能市场容量预计将达到228亿美元。同时,大数据、人工智能、机器学习、深度学习等技术的快速发展,也促进了商业智能和数据分析产品的新一轮进化。Gartner分析师认为,到2020年,自然语言生成和人工智能将是90%的新BI平台的标准特征,50%的分析查询将使用搜索、自然语言处理,或语音生成,或将自动生成。但我们必须认识到,我国商业智能的市场特征、企业需求、关注点、发展阶段均与国外有所不同,以Gartner为代表的分析机构并不能准确描述我国商业智能行业的实际状况。针对这一问题,帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。主要预测:2018年,中国大数据 BI 产品将主要在自助分析的可操作性和功能丰富度、平台的安全性、数据管理能力、分析的共享能力、数据挖掘能力、大数据处理能力六大功能模块进行提升。一、2018年中国商业智能行业发展分析(一) 行业总体形势向好在当前经济环境下,企业盈利的压力和难度不断增加,越来越多的企业,尤其是一、二线稍具业务规模的企业,其高层都希望通过精细化运营提升市场竞争力,降低企业的运营成本。这些企业绝大多数都已经在2008年~2015年间上线了各种业务系统,存储了大量管理和运营数据,具备应用大数据BI进行数据分析和数据化管理的各种条件,这些需求将在2018年~2022年继续爆发。值得注意的是,艾瑞咨询在《2017年中国商业智能行业研究报告》中指出,我国已经进入商业智能领域第一方阵,成为发展最快的国家之一,但和美国还有比较大的差距。所以未来中国大数据BI行业总体将呈现加速度增长,市场容量将不断扩大。(二) 大数据BI厂商马太效应显现马太效应是指强者越强,弱者越弱的现象,国内BI行业的马太效应已经显现。据帆软品牌部调研数据显示,处于行业第一梯队的帆软、Tableau、微软PowerBI的品牌知名度和市场份额与其他厂商进一步拉大。帆软2017年全年营收2.77亿,远超其他国内厂商之和。同时帆软销售部反映,2017年度销售跟单中遇到的竞品种类和数量均较2016年有相当大幅度的下降。BI行业出现马太效应实属必然,综合实力强大的厂商更能投入资源做好产品、服务,解决更多用户的需求和问题。可以预见,2018年中国BI行业马太效应将进一步增强,逐步淘汰掉实力弱、规模小、产品差的企业。(三) 新型自助式BI与传统型BI平分秋色得益于敏捷、自助的特征,从2013年起新型自助式BI迎来了高速发展期,这一时期也是传统型BI的衰退期。2017年,传统型BI与新型自助式BI在国内市场中平分秋色。受访企业中,约50.2%的企业仍然在使用传统型BI,其中最典型的需求是企业常规日报、月报等汇总分析报告。约49.8%的企业应用新型自助式BI,通过报表平台+自助式BI+大数据底层平台的解决方案,来解决企业综合的数据展示和分析需求,形成经营和战略决策。在调研中我们注意到,约有18%的企业引进了新型自助式BI,部分或全部替代了传统BI。虽然传统型BI尤其自身优势和应用场景,但随着新型自助式BI的不断发展,传统型BI必将逐渐退出历史舞台,从国际传统BI巨头积极调整产品结构可见一斑。二、2017年中国商业智能用户状况分析根据企业的IT人员和业务人员在数据分析中的工作量和投入程度占比,我们将BI用户(企业)划分为5大类型,即BI应用金字塔模型,以更好的统计、分析企业的BI应用状况。(一) BI应用金字塔模型1. IT完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成95%以上的BI分析页面(注:主要是指用于生产、经营、管理会议所需要的数据分析页面,下同)的开发。业务人员仅负责前端数据查看,完成查看报表时相关联动钻取操作。调研中我们发现,处于“IT完全主导型”这一等级的企业,约有93.2%都在使用传统型BI工具,企业的业务人员基本没有能力,也没有需求去自主完成数据分析的工作。这些企业的业务变革并不剧烈,企业管理层认为当前的日常数据报告能够满足企业管理和决策的需要,相对缺少变革的动力。2. IT强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成80%~95%数量的BI分析页面。业务人员完成低于20%数量的BI分析页面。从调研数据来看,这类企业中,67.5%的企业认为当前业务人员不具备数据分析的能力。而企业需要快速完成部分数据分析工作,所以选择让IT人员更多承担工作。这类企业中普遍认为,商业智能产品本身并非能够快速上手,且业务人员仍需要统计学基础,阻碍数据分析工作从IT人员向业务人员的转移。3. 业务强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成前期示例不超过20%数量的BI分析页面。业务人员完成超过80%数量的BI分析页面。从调研数据来看,这类企业中,超过80.2%是曾经推行传统BI的企业,并且部分业务人员是有较高学历和能力的,能够学习和掌握商业智能工具和数据分析技能,并愿意在工作中积极使用;从帆软数据应用研究院的实地走访的部分企业来看,这些企业普遍行业排名靠前,公司从高层就重视数据分析工作。4. 业务完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的部分相关工作。业务人员完成95%以上数量的BI分析页面和相当部分BI工具层面的数据模型处理。相比于第三类使用人群(业务强主导型),这类用户的一大特点是业务变革十分迅速,从事业务工作的人员学历普遍较高,业务经营和发展需要企业快速做出决策。而基于数据分析得出的业务判断相比个人历史经验准确度更高,是这类企业基本共识。比如在新兴的互联网企业,或者新零售领域,这个特点尤为突出。5. 智能自助型其典型特征为,IT人员只做底层数据仓库、数据连接、数据字典相关工作。业务人员处理所有BI工具层面的数据处理,以及所有BI分析页面。IT人员搭建数据中心,业务人员完全自主处理和分析数据,这类企业有着明显的资源密集型的特点,业务人员更多的是偏向运营相关的工作。当然,因为此类受访企业占比较少,原因分析的可信度还有待进一步调研来核实。(二) BI用户状况分布基于BI应用金字塔模型,2017年企业分布如下;从调研数据中,我们可以得出两大结论。1、IT人员主导企业数据分析的模式仍占据主流,也就是IT驱动仍是2017年企业商业智能平台应用现状。从数据调研的受访企业来看,有高达60.5%的企业的数据分析工作仍是第二类型(IT强主导型),甚至有21.5%的企业的数据分析工作处在第一类型(IT完全主导型),这显然和业务人员自助数据分析的目标距离遥远。2、新型自助BI正在成为商业智能市场的主流。17.5%的企业是在2017年上线了新型自助BI,实现了让少部分业务人员自助完成BI数据分析的目标。三、2018年商业智能用户需求分析(一) 企业多级部门数据分层次IT权限和平台管控,占受访企业97.6%需求描述:BI工具支持企业的多级部门的数据/分析页面权限管控,使得不同层级的部门机构只能看到本部门机构和辖属部门机构的数据/分析页面。需求产生的原因:有的信息中心为释放压力,放权给业务部门使用数据,一旦口子打开,数据缺口就会像洪水一样泛滥,就又会走向另外一个极端,导致放权下的数据管理混乱,数据口径不统一,部门之间的数据壁垒等等问题就会出现,同时这将给企业带来极大的数据安全隐患。满足该需求对企业的价值和意义:在满足业务部门BI数据自助分析的同时,兼顾企业的数据权限管控,形成企业以IT部门集中管理下的良性数据分析风貌,杜绝企业数据安全隐患。(二) 业务人员可通过BI工具进行自助数据分析,占受访企业94.5%。需求描述:业务人员可以在浏览器前端,对自己权限范围内的数据进行多维拖拽探索和自助分析,发掘隐含在数据中的业务价值。需求产生的原因:企业的传统信息化建设中,IT信息中心对公司数据进行高度集中的管控,来自企业各职能部门的数据处理以及报表就会全部由IT人员来输出,一旦业务部门需求集中扎堆,就会造成响应不足,业务部门怨声载道。信息中心自身成员熬夜加班做报表,成就感却很低。满足该需求对企业的价值和意义:通过高效灵活的BI工具,业务人员对自己权限范围内感兴趣数据进行多维拖拽探索和自助分析,以工具简单易上手的低学习成本,让真正对分析业务价值最熟悉的业务人员实现自助数据分析探索,最大化业务数据的分析维度和分析效率,灵活发掘数据中可能潜在的业务价值,同时也解放了IT人员的劳动力,降低企业人力成本。(三) 可快速搭建型自助BI业务数据模型,占受访企业87.5%。需求描述:数据库表中的数据需要基于业务分析主题进行分类管理,相关数据表之间支持手动/自动构建关联模型,同时建立的关联模型支持灵活应用,无需反复编辑修改或创建新的模型,一次建立即可灵活满足多重业务场景进行数据分析使用。需求产生的原因:传统BI工具创建的底层数据关联相互独立,无法重复利用,一旦遇到新的业务数据计算分析场景,数据关联就需要修改或重新创建,极为麻烦,非常不利于IT人员维护。满足该需求对企业的价值和意义:通过BI工具快速构建的新型自助式BI业务数据模型,较传统BI工具针对不同业务分析场景需要多次、重复建模的应用痛点,极大地提高了BI工具的企业中业务数据分析应用的效率,解放了以往IT人员对数据维护的压力。(四) OLAP多维分析:上卷、下钻、旋转、切片、联动、跳转等,占受访企业84.5%需求描述:BI工具支持强大的页面OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。需求产生的原因:随着业务发展的复杂化,单一角度的数据分析往往难以再发掘出更多有价值的潜在业务信息,取而代之的是需要BI工具能够满足强大的页面OLAP多维分析功能。满足该需求对企业的价值和意义:通过BI工具强大的OLAP多维分析功能,以实现多角度、多关联数据之间的数据无限层次探索分析,发掘出数据中潜在的业务价值。(五) 大数据处理性能处理能力达到十亿数据秒级响应,占受访企业63.6%需求描述:BI工具可支撑处理亿级以上大数据分析计算的秒级响应,提供多维加速引擎对传统关系型数据仓库(SQLServer、Oracle、Mysql等)进行数据提速处理,同时也支持实时对接企业大数据平台(Vertical、Kylin、Greenplum等)进行数据分析计算。需求产生的原因:一方面,传统关系型数据库在面对上亿级别以上数据量时,容易出现性能瓶颈,长时间的查询等待往往会导致业务数据分析效率太低。另一方面,当今信息化水平飞速发展,越来越多的企业已经有了自己的高性能大数据平台,对于这部分企业来说,拥有一款能够直接对接大数据平台进行数据分析的工具尤为总要。满足该需求对企业的价值和意义:BI工具提供的强大数据计算处理引擎,能够降低企业数据查询等待时间成本,提高业务数据分析效率。同时,通过直接对接企业大数据平台,还可满足企业实时数据分析的需求。(六) 业务人员可完成工具层面的零代码数据加工处理工作,占受访企业57.5%。需求描述:BI工具可通过快速易上手的交互方式,让业务人员也能完成工具层面的零代码数据加工处理工作,例如例如表合并、分组统计、结构数据分层、过滤、增加列、同比环比、累计值、所有值、公式运算等数据清洗和数据处理方法,实现对数据的无限层次多维透视分析统计。需求产生的原因:当业务需求相对偏复杂时,简单的维度和指标统计往往无法直接计算出业务所需要的计算结果,以往的处理方式往往可能是业务部门提需求给IT,然后IT经过SQL或者代码对底层数据表加工处理,然后最终导出一张excel数据表给业务部门,期间的反复沟通和等待时间往往降低了企业的业务数据分析应用效率。满足该需求对企业的价值和意义:通过BI工具,使得业务人员也能快速实现对数据的无限层次多维透视分和析加工统计,降低了传统模式下的沟通成本和等待时间,提高了企业业务数据分析的应用效率。(七) 移动端数据分析查看支持,占受访企业44.9%需求描述:BI工具支持移动端数据分析多维分析查看功能(兼容PC端的上卷、下钻、旋转、切片、联动、跳转等),对于BI工具的应用app支持便捷的扫码登陆、离线查看、批注、分享等功能,同时满足某些社区平台如微信、钉钉的企业公众号集成。需求产生的原因:在当今这个移动设备便捷时代,仅仅PC端的数据分析已经不能满足某些特定时间和场所的业务分析需求了,而BI对移动端的支持已经成了必然要满足的功能点。满足该需求对企业的价值和意义:通过移动端的BI分析查看,使得数据分析不仅仅局限于PC端,较大地增强了数据分析的便捷性。同时微信和钉钉的集成接入,让业务通过社区平台也能直接查看想要的数据分析页面,更是为移动端数据分析锦上添花。四、中国大数据BI产品功能预测结合用户需求调研,和我国BI厂商的产品计划研究,2018年如下六个大的功能模块将会得到增强。(一) 提升自助分析的可操作性和功能丰富度为满足业务人员可通过BI工具进行自助数据分析的需求,中国大数据BI产品需要改善自助分析的功能和可操作性,包括图表的丰富性。前端布局自定义搭配,让业务人员随心所欲布置。比如仪表板自由布局,可快速拖拽生成所需要分析的页面;在全面支持常见的柱状图、条形图等图形基础上,增加支持中国(世界)地图、GIS地图、桑基图等大数据图表;为了适应更加多样的用户,大数据BI平台需要支持强大的OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。业务人员在OLAP多维分析的基础上,能够在数据分析查看时,再次对所有维度进行二次的维度指标加工,并无限层次多维透视分析统计,全面开放业务人员对数据的处理和分析操作,以满足当前中国用户多个视角、多个层级的分析需求,把传统业务分析的智慧充分沉淀到数据分析系统中来。为了给不同用户提供个性化的视觉体验,大数据BI平台支持表格动态数值预警功能和图形设置动态警戒线,支持图表样式风格自由拖拽调整。同时,也需要大数据BI平台智能自动设置预警值和样式风格等。(二) 提升平台的数据挖掘能力为满足企业业务人员自助数据分析和自动挖掘的需求,中国大数据BI产品需要在已有的数据可视化和数据分析的功能基础上,增强数据自动挖掘能力,使业务人员在能够掌握挖掘基本概念的基础上,深入挖掘分析业务数据,为业务运营提供数据结论支持。大数据BI平台需要支持嵌入式高级分析功能,用户能够轻松使用平台内置的高级分析功能,也可以通过导入和集成外部开发的高级分析模型。比如平台内含数据挖掘常见算法(如线性预测、时序预测、聚类、分类等),或者提供外接其他数据挖掘平台和工具的可视化接口(如R语言或者Python语言),甚至内含适合特定业务场景的挖掘模型 。(三) 提升平台大数据处理能力为满足企业对大数据BI平台实时响应的需求,中国大数据BI产品需要将当前大数据处理能力提升一个量级,达到10亿数据量秒级响应水平,同时支持丰富多样的数据源。大数据BI平台需要支持丰富的数据源,如企业主流的关系型数据库、大数据平台、NOSQL数据库以及多维数据库,需要支持实时对接数据平台和分布式引擎拓展,同时支持跨数据源关联,同时支持对较大级别数据量进行数据抽取和索引建模,提高数据分析效率。(四) 提升平台的数据管理能力为了满足中国企业业务人员用户对数据处理的需求,中国大数据BI平台需要提升自身的元数据管理能力、数据的ETL处理能力、数据存储能力。提高元数据管理能力,使得用户能够集中管理元数据,包括对元数据进行检索、提取、处理、存储、分享复用和对外发布。中国企业的业务人员将需要在数据分析的过程中,直接操作经过IT人员标准化处理的元数据。近几年来,中国数据分析人才迅速增加,企业中也成长出一批有一定数据分析能力的业务人才,这些中国企业业务人才更多的是需要对数据进行ETL处理和存储,这就需要平台功支持用于查询、提取、转换和加载的功能,具有索引、管理、调度数据的能力。(五) 提升平台分析的共享能力随着ERP、OA、MES、HIS等常见业务系统的完善,企业少则数十套IT系统,多则上千套系统。新型自助BI需要能够与多个系统同时融合,全面分析企业的业务数据。这就需要中国大数据BI产品需要加强产品与不同软件系统的集成融合能力,这是中国企业面临的共同难题。大数据BI平台需要支持嵌入式部署,如主流的应用服务器,支持跨平台的权限集成和页面集成。大数据BI平台不同用户创建的分析页面,可以方便地分享给其他成员。同时,在企业的分析用户设计仪表板时,可以复用仪表板中的图表、维度、指标等,支持用户分享指定页面进行给其他部门成员,便于互动沟通交流。为满足企业人员实时办公、互通信息的需要。大数据BI平台还需要支持移动端上共享和查看分析结果,支持在移动端对分析结果进行数据层级钻取穿透、联动等。(六) 提升平台的安全性为了满足企业多级部门同时使用、不同权限的功能,中国大数据BI产品除了要提供灵活丰富的用户管理功能、权限控制功能,还需要内置强大的用户行为监控与分析功能,确保企业的数据安全和信息保密。大数据BI平台将支持持批量导入用户,支持同步企业统一权限管理数据库中的用户,以企业IT系统统一的用户管理方式进行用户管理。支持用户以企业IT系统统一的用户权限认证方式进行权限管理。同时,需要支持短信平台功能,并可用于用户账号身份验证等,多种用户和权限管理方式,来满足广大中国企业的不同的安全级别要求和安全管理策略。随着大数据BI在中国的发展,中国企业自身的大数据BI平台已有众多员工账号。这就对大数据BI平台提出新的挑战,除了要拦截非法用户,还要对大数据BI平台有效用户进行有效监控。2018年,大数据BI平台需要支持监控用户的操作行为,支持监控页面被访问的频次、访问来源,甚至是支持监控访问到的数据范围。为了保证大数据 BI平台系统持续支持企业经营管理,需要大数据BI平台支持系统数据迁移到企业数据库,支持对系统进行备份与还原,备份可以手动或设置周期定时备份。同时,支持云端服务器部署和本地服务器部署,支持多机热备,达到企业的灾备要求。此外,为了有效避免BI平台出现严重异常,还需要支持监控自身的运行性能,遇到系统性能风险,提前给出系统预警信号。
大众网·海报新闻记者 王艺霏 东营报道9月17日,《关于东营市跨境电商发展的调研报告》报告发布会在在东营黄河三角洲大数据港(北区)三楼电子商务交易技术国家程实验室·黄河三角洲众智产业大数据示范基地举行。东营市近年来形成了橡胶轮胎、有色金属、石油化工、精细化工、石油装备、汽车零部件、精密铸造等特色产业,同时,据数据显示,2019年,东营市完成外贸进出口1629.1亿元,其中出口342.8亿元,进口1286.4亿元,进出口、出口和进口总额分别列全省第4位、第9位、第2位,整体经济外向度达到50%以上。关于东营市特色产业、交通条件、整体经济几大因素,现已经形成了较为完整的产业链条和供应链条。2020年5月6日,国务院发布《关于同意在雄安新区等46个城市和地区设立跨境电子商务综合试验区的批复》,同意在46个城市和地区设立跨境电子商务综合试验区,东营市位列其中。为了响应政策,6月28日东营市政府印发的《关于加快电子商务产业发展的实施意见》中提出“加快发展跨境电子商务。培育引进5家以上跨境电子商务平台型企业及综合服务企业,建设3个跨境电子商务创新创业孵化基地。”电子商务交易技术国家工程实验室平台架构设计师岳刚表示:东营市跨境电商的发展要多借鉴其他地区和企业的成功经验,从经济环境、政策环境、技术因素等方面入手分析,从而促就东营市跨境电商的发展。此报告在国内跨境电子商务发展情况、东营跨境电子商务发展环境分析、促进东营跨境电子商务发展的对策建议三个方面,浅析东营跨境电子商务发展道路。
来源:新浪科技第五章 产业与技术发展状况二、前沿技术发展状况(四)大数据发展状况2019年,大数据领域政策环境逐步完善,技术创新不断推进,产业应用持续深化,共同推动大数据领域发展。大数据产业布局持续加强。一是党的十九届四中全会提出要“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,首次将数据与劳动、资本、土地、知识、技术和管理并列作为参与分配的生产要素,同时提出要“推进数字政府建设,加强数据有序共享,依法保护个人信息”,数据生命各周期的监管与保护越来越受到重视。二是地方政府颁布各项法规,强化大数据领域的安全保障。例如,2019年10月1日,我国大数据安全保护层面第一部地方性法规《贵州省大数据安全保障条例》正式施行,这标志着贵州明确了大数据产业相关安全监管主体及其职责,大数据安全有了保障。三是各地政府相继成立地方性大数据管理机构,陆续出台大数据产业规划,不断优化区域产业发展环境,致力于发挥大数据对经济社会转型发展的引领作用。截至2019年12月,全国已有20个省(区、市)成立了负责大数据相关业务的省级管理机构,未成立省级管理机构的省(区、市)中有6个已发布大数据相关产业发展规划。大数据已成为新一代信息技术融合应用的焦点。作为实现创新发展的重要动能,大数据技术已成为我国信息化建设的重要支撑。随着相关技术的不断演进和应用持续深化,大数据正成为提高全要素劳动生产率、提升产业附加值的核心。2019年,依托大数据,智能计算实现了较为迅速的发展。例如,2019年8月,华为推出了目前单芯片计算密度最大的AI处理器昇腾910,其作为华为AI解决方案的底层芯片,能够有效运用智能计算等大数据技术,并加速AI技术在电力、互联网等行业的应用;9月,阿里云推出了第一颗自研芯片含光800,该芯片采用自研芯片架构,利用先进算法,深度优化计算、存储密度,在推理性能和能效比方面均打破世界纪录,成为全球最强AI推理芯片。稳定增长的大数据市场对经济社会发展的引领作用日益凸显。一方面,数据显示,2019年我国大数据市场总体收益达96亿美元,2019年至2023年预测期内的复合年均增长率为23.5%,增速高于全球平均水平,其中服务器和存储设备等大数据相关硬件服务占比最高,达到45.2%,IT(Information Technology,信息技术)服务和商业服务等大数据相关服务收入占比为32.2%,软件收益占比为22.6%。另一方面,大数据与零售、工业、金融、安防、营销、健康等领域的融合程度不断加深,在整合生产要素、促进经济转型、催生发展新业态、支撑决策研究等方面的作用愈发明显。近年来,制造业企业纷纷以大数据算法模型为指导,实现供需精准匹配,通过数字化手段推动销售增长。工业大数据正成为企业转型的核心驱动力,未来将在研发设计、生产制造、供应链协同和售后服务等多个环节助力工业高质量发展。2020年大数据领域将呈现以下十大发展趋势:一是数据科学与人工智能的结合越来越紧密;二是数据科学带动多学科融合,基础理论研究的重要性受到重视,但理论突破进展缓慢;三是大数据的安全和隐私保护成为研究热点;四是机器学习继续成为大数据智能分析的核心技术;五是基于知识图谱的大数据应用成为热门应用场景;六是数据融合治理和数据质量管理工具成为应用瓶颈;七是基于区块链技术的大数据应用场景渐渐丰富;八是对基于大数据进行因果分析的研究得到越来越多的重视;九是数据的语义化和知识化是数据价值的基础问题;十是边缘计算和云计算将在大数据处理中成为互补模型。
随着社会发展、政策的加持以及新冠疫情的催化,传统产业转型势在必行当下,传统产业效率低、成本高的发展模式不可持续,亟需转型。传统产业运用前沿技术进行数字化与智能化转型,将大大降低能耗与成本。政府重视新基建发展,连续出台相关政策和指导意见,为产业智能化提供良好的发展环境和技术保障,推动产业智能化往纵深发展。2020年伊始,全球疫情的爆发,加速传统产业与前沿技术的融合,为产业智能化第三方解决方案提供商、数据中台企业等带来了天然优势。从总的发展方向来看,产业智能化一定是一个必然的发展趋势。信息技术的发展和人工智能技术的落地是推动产业智能化发展的直接动因从信息技术的发展层面来看,产业智能化发展涉及到众多前沿技术,如人工智能、云计算、大数据、物联网等。传统产业数字转型与智能升级的途径是利用IT系统与新技术破解企业在发展过程中遇到的瓶颈和升级难题,重新定义和整合设计、生产、流通销售、服务全链路,实现业务创新和增长。从人工智能落地发展策略来看,第一、二产业智能化进程中,能够整合更多的资源(技术、行业等),产业智能化新格局也会逐渐形成。从人工智能落地发展基本面来看,“平台化”建设将是推动产业智能化发展的重要力量,集战略咨询、架构设计、数据运营等关键服务于一体,且能为企业提供“一站式”的核心数字技术及第三方服务平台是产业智能化发展的重要中间角色。坤湛科技能够为传统行业提供从战略规划到技术实施的全方位智能化解决方案2020年6月9日,坤湛科技宣布完成超2,000万美元首轮融资,由高榕资本领投,投后估值近2亿美元。产业智能化发展的过程,就是不断为传统产业转型过程中遇到的痛点提供解决方案的过程。2019年,产业智能化系统服务提供商坤湛科技应运而生,其主要核心团队成员由全球范围专注科技创新与产业实践的精英组成,且吸纳了来自BAT的技术专家。创始团队成员曾服务8大行业客户,成功交付100+转型项目,为客户增收数十亿元,拥有丰富的产业创新经验和技术方法论,聚焦传统产业(工业、农业、零售、物流、医疗等),提供沉浸式数字化转型与智能升级服务。集战略咨询、架构设计、数字化运营等关键服务于一体,且能为企业提供“一站式”解决方案的第三方服务商相对较少。另外,数字鸿沟明显,产业协同水平较低,产业链上下游企业之间信息不对称问题突出,平台针对用户信息、行业数据等资源的开放程度普遍不高。基于此,集产业智能方法论和产业智能操作系统于一体的服务商具有非常大的发展空间,也是产业智能化发展必不可少的第三方服务平台。未来,坤湛科技将深入到产业,做“技术+产业”的专家,为企业提供更多的附加和增值服务,打造更为多元化的盈利模式。随着科技进步及数字化技术深度应用,传统产业智能化即将迎来黄金发展期。那么,传统产业智能化发展过程中将会遇到哪些具体的问题?坤湛科技又将以什么样的方式来解决问题并赋能传统产业的呢?以下为《为传统行业提供从战略规划到技术实施的全方位智能化解决方案》36Kr-坤湛科技企业调研报告全文,点击报告链接(https://pan..com/share/init?surl=9BMAmZDrr833X6YwxBMbPQ)下载报告全文。提取码:qx49注:基础设施是指为社会生产和居民生活提供公共服务的工程设施,是用于保证国家或地区社会经济活动正常进行的公共服务系统,是社会赖以生存发展的物质基础条件。参考资料:1. 新华网,瞭望东方周刊,《新基建,是什么?》,2020-04-262. 《为什么产业智能化是不可避免的》,中国科学院沈阳计算技术研究所 副研究员,IT人刘俊明3. 坤湛科技调研,闵万里、王金明
前瞻根据IT桔子数据,结合独角兽定义筛选出2018年有外部融资且估值超10亿美元的优秀企业,中国共有203家企业上榜。2018年独角兽行业分布:汽车交通业数量最多,金融业合计估值最高从企业数量的行业分布来看,2018年中国独角兽企业分布在汽车交通领域的数量最多,达到27家。金融、企业服务、电子商务、医疗健康、物流、文化娱乐、硬件、教育、房产服务领域的企业数量均达到10家及以上,本地生活、旅游等领域的企业数量还较少。从企业估值的行业分布来看,金融业合计估值最高,达到2845.16亿美元,占据全部独角兽估值的30.29%。其次是文化娱乐,达到1315.35亿美元,占据14.00%。汽车交通和企业服务居第三四位,分别占12.77%和12.20%2018年独角兽区域分布:北京地区数量与合计估值均最多从企业数量的区域分布来看,2018年中国独角兽企业分布在北京地区的数量最多,达到87家。上海、广东和浙江位居其后,分别为40家、27家和24家。江苏、香港、四川、湖北、重庆、山东、安徽数量较少,均低于10家 。从企业估值的区域分布来看,北京地区合计估值最高,达到3649.04亿美元,占据全部独角兽估值的38.84%。其次是浙江,达到3057.33亿美元,占据32.55%。上海居第三位,达到1300.58亿美元,占13.84%。广东、江苏、湖北、四川等地合计估值较少,占比均低于全国的10%。各行业平均单个独角兽企业估值:金融业最高,社交网络最低2018年中国独角兽平均单个独角兽企业估值为46.28亿美元,金融为平均单个独角兽企业估值最高的行业,为113.81亿美元;文化娱乐、企业服务、物流业也均高于平均值46.28亿美元;本地生活、硬件、汽车交通、广告营销等行业低于行业均值46.28亿美元。独角兽估值区间分布:百亿超级独角兽达13家,占独角兽总数的6%2018年,估值超过100亿美元以上的超级独角兽企业有13家,合计估值为5506.31亿美元,占据全部独角兽估值的30.65%;估值在50-100亿美元的企业也有13家,合计估值为773.15亿美元,占比位4.3%;估值在30-50亿美元区间的企业有32家,合计估值为1098.34亿美元,占比6.11%;估值在10-30亿美元区间的企业有145家,合计估值为10585.00亿美元,占比为58.93%。超级独角兽行业与区域分布:主要分布于4地区和7大行业2018年,中国估值超过百亿的超级独角兽企业主要分布于北京、浙江、广东和上海4地区,企业数量分别为6家、4家、2家和1家。主要分布于金融、文化娱乐、企业服务、汽车交通、物流、本地生活、硬件7大行业,估值占比分别为43.43%、17.25%、12.91%、10.90%、6.07%、5.45%、4.00%。
过去20年间,伴随着数字经济的发展,消费模式和消费场景的转变可谓沧海桑田。自1996年比尔盖茨喊出了“内容为王”的口号,人们渐渐地开始习惯了从移动端进行消费活动,用手机App订餐、购买机票火车票、订酒店;逛网上超市、使用网上支付;使用网上营业厅代替到银行网点排号办理金融业务;在App的指导下在家里健身;拥有不同兴趣爱好的人们甚至在互联网的世界里实现了跨境社交(网游、旅行内容分享、追星、网红养成等)。互联网无时无刻不在汲取和留存着人们的行为轨迹和消费记录,这些日常行为数据,包含着不同国籍公民的个人信息,共同组成了大数据的汪洋大海。大数据企业为品牌商的海外市场拓展提供营销渠道和商业洞察支持,然而大数据企业的企业战略如果缺少了数据应用合规框架,会将企业置于违反数据跨境政策的法务风险之中。1.大数据企业特征1.1大数据技术商业应用的企业主体企业可以利用大数据来识别和界定营销机会。大数据技术能够通过分析在互联网上发生的消费数据,告诉企业消费行为的影响因素有哪些,从而更精确地和有针对性地帮助企业调整其产品概念、包装、内容,以及进行营销策略的部署。大数据技术商业应用最出色的企业,通常会是已有获取大数据能力的互联网公司,以及专业经营数据采集、数据分析,和售卖洞察报告的市场调研公司。互联网公司作为消费和零售的新载体,成为天生的大数据企业(BigDataOwner)。市场营销因为互联网技术得到了重塑,越来越多的国际品牌商推出一款新产品或者新概念时,可以选择通过互联网电子商务的渠道在全球多个国家和地区同步上市,例如iPhone、华为等手机厂商在全球主要市场同步推出自己当年的旗舰机型。今天,如果你问任何一家互联网公司,什么是最重要的,源源不断的数据流很有可能将是这个问题的答案。数据变得极具价值,庞大的流量数据造就了谷歌、亚马逊、阿里、腾讯、京东这样的大数据独角兽。反过来,这些大数据企业以其强大的科技、经济和社会影响力,也在进一步改造着整个市场生态。品牌方从单一的互联网途径获取的数据和报告,能部分地了解消费者行为,但要了解消费者态度,专业的市场调研仍然是最准确的方法。比如广告投放后的效果评估,消费者行为的变化(访问、搜索、到店……),甚至购买行为的转化率都可以通过大数据分析获得,但消费者对品牌的认知/喜好/忠诚度的提升,则需通过调研形式去了解——这是市场调研企业的专业领域。与互联网企业依靠自有互联网产品自然产出数据的方式不同,市场调研企业作为独立于商家、消费者、电子商务平台的完全第三方,依靠工序复杂而繁冗的数据采集过程获取消费者的态度数据。无论是互联网企业,还是市场调研企业,作为大数据拥有者,已然将大数据作为公司战略在积极布局和实践。然而大数据解决方案之于大数据企业,不仅在于驾驭海量的数据,更需要部署相应的数据应用合规框架,规范数据的管理。在浩瀚的数据中,最为棘手和敏感的是包含了个人信息的隐私数据。1.2大数据企业的数据分散性和数据服务器中心化当互联网企业发展壮大到一定规模,国内用户市场饱和时,其必然会凭借其已被市场教育得趋于成熟的产品,将目光投向更广泛的海外用户身上。因此,互联网企业的用户数据随着互联网企业的出海,呈现出跨越国界的分散性特征,例如中国阿里的淘宝、字节跳动的抖音、腾讯的微信产品(见表1),均面向其海外用户推出了海外版应用产品;国外互联网企业也有面向中国用户的产品,例如过去的谷歌和亚马逊,虽然他们分别于2010年和2019年退出了中国市场,其中谷歌退出中国市场的原因是作为美国企业,其对中国用户隐私保护相关法律的约束有着不同的认识。与此相反的是,互联网企业的服务器部署呈现中心化的特征,这是因为基于商业特质,企业必然需要从成本最优的角度考虑其在基础设施上的投入。很显然,企业不可能为每一个用户市场部署专用的境内服务器——数据跨境,实现数据的中心化存储和管理,成为了跨国互联网企业的业务需要和首要研究的课题。对于大数据技术商业应用的另一个典型主体——市场调研企业,亦是如此。在中国“一带一路”政策的倡议下,中国企业加快了出海的步伐,跨国市场调研活动可以帮助品牌方测量当时当地的市场动态,及时准确地分析和掌握当地消费者的行为和态度,从而通过有针对性的营销活动与当地消费者的有效互动,以达到促进销售、增加利润的目的。因此,市场调研企业的数据采集业务呈现出跨境、分散的特点。与互联网企业类似,市场调研企业也需要从成本最优的角度考虑部署数据跨境方案,实现数据的中心化存储和管理。表1 知名互联网企业的中国产品和海外产品举例2.数据主权和大数据企业的跨境数据合规困境2.1数据主权近年来,全球各个国家和地区的隐私和数据跨境立法节奏不断加快。一个国家的物理主权有领土、领空、领海等,随着大数据的应用越来越普及和深化,数据主权——作为一个虚拟主权,正在得到越来越多国家、企业和个人的重视。“数据主权”概念,最早始于隐私领域,是指一个人对其在社交媒体上和进行网络消费时所提供的个人信息的控制权。随着数据在数字经济时代中价值日益凸显,其概念内涵得以不断扩展。简书对“数据主权”的解释为:“对于个人而言,数据主权是指人们对自身行为产生的数据拥有使用权和所有权;对于企业而言数据主权是指对海量数据的占有和使用以及保护;对于国家而言数据主权是指存在于本国的数据要受到本国法律的约束。”来自人民日报发表于新华网的对于“数据主权”的解释为:“数据主权是指网络世界的国家主权,反应了国家对数据控制权的主体地位。”数据已经逐渐成为世界政体和企业逐鹿的焦点所在,没有人会轻易放弃对数据的控制权。放弃数据主权,意味着放弃现在和未来。甚至有人担心,随着中美贸易战的持续升级,数据主权争端将会引发自苏联解体以来新一轮世界范围内的冷战。2.2大数据企业的数据跨境合规困境2014年,美国互联网巨头谷歌在欧盟区域范围内接连遭受打压。谷歌首先被法国数据保护监管机构处以15万欧元的罚款;然后被欧盟法院裁定其应确保用户的“被遗忘权”;接着被西班牙立法规定其引用的媒体内容链接须付费;欧洲议会呼吁各监管机构应考虑将谷歌的搜索引擎和其他的商业服务分离开来;又被荷兰数据保护局告诫其应当停止侵犯荷兰互联网用户的隐私权。而2019年以来,特朗普领导的美国政府及其盟友印度,对包括华为、字节跳动等中国互联网科技企业发动了全面抵制和打击。美国商务部2019年5月宣布将华为加入其“实体清单”,之后的一段时间美国持续升级了前述禁令的级别和范围。《印度时报》报道,印度政府于2020年6月宣布印度将禁用Wechat、TikTok、微博等共59款中国互联网App,而后被封禁名单增加到了118款。如果我们从数据主权的角度来分析一下欧盟对待谷歌,以及美国、印度政府对待华为的行为,就能更好地明白,表象的背后很大一部分原因是国家对数据主权的关注。不仅是中美之间,这个世界上的其他政体,例如欧洲,对数据主权的关注要更早,已经落实在逐步完善的法律法规上。2020年7月,欧洲议会研究服务中心(EPRS)发布的一份关于《欧洲数据主权》的研究报告指出,非欧盟科技公司的经济和社会影响力威胁着欧洲公民对其个人数据的控制,并限制了欧盟高科技公司的成长和欧盟及其成员国在数据环境中的立法和执法能力。因此,欧洲要寻求加强数字领域战略自主权的新政策方法,以获得在数字世界中独立行动的能力。3.结语在新兴的大数据技术和大数据产品领域,各资本巨头均争相进入。究其原因,正如马克思主义基本原理所揭示的那样:生产力的发展,将必然会导致生产关系和社会关系的变革。大数据技术代表着当今最先进的生产力,为创业公司迅速成长为行业独角兽提供了可能。然而机遇和挑战共生共存,具有更全面的视野,掌握更成熟的大数据技术,以及重要的前提——建立完善的跨境数据合规框架,是大数据企业发挥自身优势,把握住这一机遇的关键。作者:邹 杨 齐佳音本文刊发于《中国高新科技》杂志2020年第23期(转载请注明来源)
★ 导读 ★大数据产业是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据主要应用领域包括教育、交通、能源、大健康、金融等。随着移动互联网、物联网、云计算产业的深入发展,大数据国家战略的加速落地,2019年大数据体量呈现爆发式增长态势。2018年我国大数据产业规模突破6000亿元;随着大数据在各行业的融合应用不断深化,预计2019年中国大数据市场产值将达到7150亿元。2019年包括数据挖掘、机器学习、产业转型、数据资产管理、信息安全等大数据技术及应用领域都将面临新的发展突破,成为推动经济高质量发展的新动力。为了更好的了解我国大数据产业的发展,中商产业研究院特推出《2019年中国大数据产业市场前景研究报告》。《报告》从五个方面分析当前我国大数据产业概况、大数据市场现状、大数据产业应用、大数据产业布局以及大数据产业发展前景。PART1:大数据产业概况大数据产业链可以从数据源、大数据产品、大数据服务应用这三大块来讲。目前,我国的数据来源包括政府部门、企业数据采集及供应商、互联网数据采集及供应商、数据流通平台等。而大数据产品包括大数据平台、云储存、数据安全等基础软件产品;加工分析、解决方案等软件产品;大数据采集、接入、存储、传输等硬件设备产品。大数据服务方面,主要为应用服务、分析服务、基础设施服务等供应商。PART2:大数据市场分析随着移动互联网、物联网、云计算产业的深入发展,大数据国家战略的加速落地,2019年大数据体量呈现爆发式增长态势。数据显示,2017年中国大数据产业规模达到4700亿元,同比增长30%;其中,大数据硬件产业的产值为234亿元,同比增长39%。2018年我国大数据产业规模突破6000亿元;随着大数据在各行业的融合应用不断深化,预计2019年中国大数据市场产值将达到7150亿元。2019年包括数据挖掘、机器学习、产业转型、数据资产管理、信息安全等大数据技术及应用领域都将面临新的发展突破,成为推动经济高质量发展的新动力。PART3:大数据产业应用从应用领域来看,目前大数据最广泛应用于金融领域。未来,随着大数据技术应用的覆盖范围变得更大,其他领域的领域将加强。其中,政府部门大数据技术应用的占比将提高至一位。在大数据时代背景下,政府数字化转型正在加速进行中,大数据技术的应用逐步加深,未来有望超越金融行业,成为大数据产业应用最方面的领域。金融领域位居第二,依然是大数据技术应用广泛的行业之一。PART4:大数据产业布局从大数据产业地图来看,当前大数据产业的地域布局中,东部沿海地区经济相对较发达,大数据产业的上市企业多分布在北京以及东部沿海地区,其中主要以北上广地区分布居多。据产业地图显示,北京市大数据产业上市企业数量最多,达到了37家。其次,广东省为21家;上海则为10家,其余省份的大数据上市企业均在10家以下。PART5:大数据产业发展前景未来,人口红利将转变为网民红利,成为支撑应用驱动创新的最大因素。随着老龄化社会的到来,以往在经济发展中扮演重要角色的“人口红利”逐渐消失,与此同时,我国网民规模不断扩大,网民红利更加凸显,中国已是世界上产生和积累数据体量最大、类型最丰富的国家之一。依托庞大的数字资源与用户市场,使得中国企业在应用驱动创新方面更具优势,大量新应用和服务将层出不穷并迅速普及。报告仅展示部分,详情请下载《2019年中国大数据产业市场前景研究报告》http://wk.askci.com/details/fa844728727d45feb3bd9dba2162d8fe/点击快速下载完整版
大数据整体市场规模达1000亿,其中行业应用市场规模为700亿,是最大细分领域。大数据在互联网、政府、金融成熟度最高。爱分析认为,提供整体解决方案的大数据公司机会最大。近日,爱分析在京举办了2018·中国大数据高峰论坛。TalkingData创始人崔晓波、邦盛科技创始人王新宇、九章云极创始人方磊等7位明星CEO分享了未来几年大数据行业的深度观察,爱分析在会上发布了《中国大数据行业报告》(以下简称报告)。《报告》称,2017年大数据行业整体市场规模1000亿,其中行业应用细分市场规模为700亿,是大数据行业最大细分领域,大数据在金融、政务、互联网成熟度最高。大数据整体市场规模1000亿,细分市场行业应用规模最大《报告》显示,整个大数据产业分为基础平台、通用技术、行业应用等多个细分市场,2017年大数据整体市场规模1000亿。细分市场中,基础平台整体市场规模在100亿元左右,通用技术整体市场规模在200亿元左右。行业应用层,大数据在各个行业应用差异较大,应用相对成熟的金融、政府领域市场规模为200亿元。整个行业应用市场规模为700亿。大数据在金融、政务、互联网成熟度最高《报告》显示,大数据在各行各业的成熟度与基础设施、市场规模和应用范围关系密切。根据调研,金融、政务、互联网这三个行业的IT投入位列各行业前列,随着“互联网+政务”的普及、政务云和政务大数据的落地,政府2017年IT投入超过800亿元,占中国IT总投入的5-10%。金融一直是重IT投入的行业,以银行为例,2017年中国银行业整体IT投资为800亿元,整个金融行业的IT投资突破千亿元大关。基础设施成熟度同样会对大数据应用落地应用产生很大影响。信息化是大数据的基础,互联网行业信息化程度最高,金融、政务行业在20世纪初已开始进行信息化建设,经历十几年发展,基础信息化已建设完毕。相比医疗、工业等领域,金融、政务和互联网行业结构化数据占比高,数据标准化程度高。云计算、大数据、AI、IoT多项技术融合是未来趋势,提供整体解决方案的公司机会最大《报告》指出,与国外不同,中国市场云计算、大数据、AI、IoT等技术几乎是同时间爆发,企业客户同一时间采购云计算、大数据、AI等产品,企业客户最终目的是通过新技术来实现开源节流,实现这一目标需要多项技术融合,技术边界正逐步模糊。云计算作为大数据的基础,大幅降低企业的IT硬件成本,将有超过50%的IT预算投入到大数据、AI等应用。AI促使大数据从辅助决策向替代决策进化,使大数据厂商突破工具软件天花板,发展空间放大10倍。在智能客服领域,AI技术的发展使得技术厂商的市场空间由原先的30-50亿提升到300-400亿。IoT技术的发展补全线下数据和机器数据,给大数据应用带来更加多元的数据,产生更加丰富的应用场景。在营销领域,通过WIFI、蓝牙、摄像头等途径,实现线上、线下数据的打通,形成整个营销闭环,从而实现跟踪用户的全生命周期,提升用户转化率。多项技术融合促使客户的需求更加多元化、复杂化,提供整体解决方案的大数据公司更加符合未来趋势,在整个产业链占据更重要地位,提供更加深度的场景化应用。以下为爱分析高级分析师李喆在会上发布报告的演讲实录。演讲实录李喆:在看待大数据行业未来趋势时,首先需要关注中美技术路径发展的差异,不仅仅是大数据,还包括云计算和AI等。从这张图,我们可以得出有几个结论:第一, 我们看到美国的市场是技术驱动,先从底层基础平台成熟,逐步延伸到上层应用。2006年AWS对外进行提供服务,2009-2010年大数据基础平台公司Cloudera、Hortonworks成立,2015年Google开源TensorFlow平台,这些事件促使云计算、大数据、AI进入快速发展阶段。中国市场更多以应用、政策为主导,云计算行业快速发展的原因是2012-2013年游戏等移动互联网的爆发,2014-2015年,政府出台一系列利好大数据的政策,促使整个行业快速发展。因此,中国市场应用型的公司发展速度更快。国外已经上市的大数据公司Splunk、Tableau、Cloudera、MongoDB都是基础平台和通用技术层的公司。国内市场发展速度快的TalkingData、同盾科技等公司,都是属于应用型的公司。第二, 不同于美国市场每一项技术中间会有一个很大的时间间隔,中国市场云计算、大数据、人工智能这些技术时间间隔很短,几乎是同时爆发。因此,数据在各个行业的发展是不均衡的,不同行业的渗透率差异很大。同时,大数据行业不能只看大数据,需要重点关注云计算、AI对大数据行业的影响。首先,我们看云计算对大数据的影响。云计算对大数据行业最大的影响是降低了整个基础设施的成本,未来会有50%以上的IT预算会投入到应用层,也就是大数据和AI。IT预算的结构将由左边的正三角形,转变成右边的倒三角形。以银行为例,不考虑上层应用,美国的银行在IT建设上会领先于中国的银行。根据我们的调研,中国的银行IT投入的70%都是在硬件投入,剩下30%投入是软件和服务。而美国的银行只有15-20%的IT预算投向硬件,更多预算投入到软件和服务。第二个影响是容器技术的成熟,降低了大数据业务的交付成本,从原来几个月的交付时间缩短到几周。第三个影响是,随着SaaS渗透率不断提升,更多的数据汇聚到云端,更加便捷的实现数据互通互联。其次,我们看AI对于大数据的影响,AI技术可以帮助大数据突破工具软件的天花板,将市场空间放大10倍,同时还可以降低大数据公司对人力的依赖,提高人均产能。以智能客服为例,客服软件市场规模是很小的,大概是30至50亿的市场规模,但整个客服市场规模很大。中国的客服人员有300-500万人,按照平均5-6万的人力成本计算,整个客服市场规模超过2000亿。如果其中有15-20%被智能客服替代,整个市场空间就有300-400亿。但如果厂商只做客服软件,即使加上数据分析等技术,能够提升人员效率,但依然很难触及到人力这部分市场,但通过AI技术,能够实现替代人力,厂商就能切入到这300-400亿的市场。公安领域,明略数据这样的公司通过深度服务公安客户,形成这个行业的知识图谱,也就是“公安大脑”。形成“公安大脑”后,明略数据在服务其他省市公安局的时候,会大大缩短服务周期,降低公司对人力的依赖,提升业务可复制性。因为各种技术几乎同时爆发,所以我们判断,多项技术融合是未来的趋势,会大幅提升各个行业的效率。下面这张图是大数据的业务链条,包含数据源、数据的采集、数据标准化、数据分析和数据应用。可以看出,各项技术其实都会对整个链条产生影响。IoT技术,补全了原本缺失的线下数据和机器数据。比如营销领域,之前可以拿到大部分是线上数据,用户点击的广告、网页的浏览行为。IoT的发展,通过WIFI、蓝牙、摄像头等方式,可以监测到用户的线下行为,打通了整个闭环。用户在线上看广告,官网浏览商品,再到实体店体验、购买,实现线上和线下的融合,有更多方式去提升转化效率。云计算使数据更容易汇聚,降低数据收集的难度,AI技术增强了数据分析能力。智能财税领域,针对小微企业的代账市场,传统软件不具备自动化和智能化,代账SaaS软件的普及,使越来越多的中小数据汇聚到云端,而依靠机器学习等AI技术,实现自动做账、自动报税。过去每名会计最多服务20到30家企业,但是依靠SaaS、大数据、AI技术等研发的代账软件,可以服务100到200家,未来还会进一步提升。这会使得传统代账公司的重心会放在获客和增值服务,而非基础做账业务,代账公司的服务半径扩大。多项技术融合后,客户的需求会更加多样化、复杂化,因此,我们判断做整体解决方案的公司机会最大。从产业链的角度看,做整体解决方案的公司更贴近客户,更容易获取标杆客户。提供单点能力的大数据公司,更多是技术提供方的角色,无法解决客户全部需求,在客户预算中只能占到很小的份额,集成商会占据更大的份额。整体解决方案的公司提供的是自下而上的服务,因此有机会从原来的技术提供商,成为过去集成商的角色。这样会带来几个方面的好处:首先,大数据公司能够触及的预算会更大。其次,可以延伸到其他需求。美国有一家做虚拟化的公司叫VMware,最早通过虚拟化产品拿下了很多500强的客户,但现在支撑他高速增长的是SDS和SDN业务。SDN业务是VMware收购了一家初创公司Nicira发展起来的。Nicira被收购的时候没什么收入,但VMware的SDN业务,只花了三年时间就做到10亿美金的收入。抛开技术原因,另一个原因是VMware有很强的客户资源,更有机会把他的新产品推向客户。第三,降低获取其他客户的门槛。企业服务市场,获客具备非常高的门槛,尤其对于初创公司获取客户信任的周期很长。金融大数据公司进入银行市场的时候,可能前期做POC就需要一年的时间。如果你有一个标杆客户,再去向同类公司进行推广的时候,难度会大大降低。标杆客户具备灯塔效应,不论是服务同体量的客户,还是下沉到腰部客户。从场景的角度,整体解决方案的公司更有机会把场景做深,提高价值。零售领域,很多公司从营销做起,但很难切入到库存管理、供应链管理。因为这些公司多数是提供营销工具,不是一个完整的解决方案。整体解决方案公司会从帮助客户建立大数据平台做起,更有机会从前端营销切入到后端业务,通过数据去打通各个环节。这也是因为当前中国的客户能力还相对不足,直接使用工具的成本和难度都很高。大数据公司需要将业务做重,单纯一个很轻的产品,价值度较低,很难形成壁垒。接下来,我们将分享大整个大数据的产业图谱,包括我们对每个细分领域的判断。这张图是我们对整个大数据的划分,从底层基础平台到上层行业应用,分为四大细分领域。基础平台分为交易型数据库、分析型数据库和围绕这两类数据库的计算引擎。基础平台往上有两个方向,一个是数据的方向,一个是技术的方向。数据方向有两类厂商,按照是否具备数据源分为第一方和第三方。技术方向是指大数据平台之上,具备通用性的数据处理的技术,包括 BI与可视化、日志分析等。行业应用更多的是直接面向一个个场景,用大数据技术去解决各个行业的场景去落地的公司。这是我们总结的大数据市场规模。市场规模最大的是行业应用,基础平台是市场规模最小的细分领域。根据我们的调研,2017年整个中国大数据的市场规模是1000亿,我们测算的逻辑主要分成两类:一类方法是Top Down。比如,我们测算中国BI领域市场规模,我们首先看全球市场BI的市场规模,全球BI的市场规模大概是180亿美金,考虑到BI在IT投入的比例,中国和全球应该大体一致,中国的比例会略低于全球的市场。全球的IT投入大概是3.6万亿美金,中国的IT投入大概是2.3万亿人民币,因此,我们测算中国的BI市场规模大概是135亿人民币。再比如,行业应用中的工业大数据,通过我们测算大概是100亿人民币市场规模。我们的方法是通过行业成熟企业的投入比例,去推断大数据在整个工业产值的比例。国家电网2017年营收在2万亿,每年在大数据的总投入是5亿。金风科技2017年营收260亿,在大数据的投入在500-1000万之间,由此可以判断规模以上的企业投入比例大概为1-2%。另一类是Bottom Up。重点看头部公司它的收入和市场份额。基础平台这个市场,我们主要看Oracle,因为它是市占率最高的公司。2017年亚太地区的收入是45-50亿美金的数据,其中数据库的比例大概会占到30%左右,所以是十几亿美金规模,中国市场收入会比这个数据要低,Oracle的占有率是在40%至50%之间。因此我们判断国内的基础平台的市场规模在100亿左右。再比如AI平台,我们判断AI平台(数据科学平台)这个领域是20多亿的规模,主要是考虑国内市场,这个领域最大的公司是SAS,每年收入30亿美金,在亚太地区的市场份额大概占到10%左右,而他的市占率会在50-60%,因此整个市场规模会在25亿上下。从各个细分领域来看,我们还是会去重点关注大数据的行业应用,大数据的最大价值肯定是体现在行业应用。从政府的大数据发展规划来看,2020年整个大数据市场规模将达到1万亿。但从IT投入来看,2017年IT软件与服务的投入只有1500亿。因此,未来大数据厂商切的主要预算不会来自IT,而是业务预算。只有做行业应用的公司才更有机会拿到业务预算。因此,我们判断,行业应用会是未来最大的细分领域。我们重点关注的是金融、政务这两个领域,主要去通过大数据在各行各业的成熟度判断。根据爱分析大数据成熟度模型,我们主要从市场规模、基础设施和应用范围去判断各行业的成熟度,大数据在各行业的渗透情况。首先,通过我们的分析,现在最成熟的是互联网、金融、政务。金融的IT投入肯定是非常大的,银行每年的IT投入就有800亿,加上证券、保险,整个金融IT投入是超过1000亿。政务每年的IT投入大概是800亿。这两个行业在整个中国IT投入占比非常高。中国2.3万亿IT投入中,有大概1万亿左右是运营商资源。去除掉这部分,金融和政务加起来会占到总投入的20%以上,现阶段大数据投入主要还是来自IT预算。其次,互联网、金融和政务,信息化建设是最完善的,这里的信息化建设不光是基础业务系统搭建,还包括数据的标准化、结构化程度。医疗的基础设施相对完善,IT投入也很高,但我们不认为它会优先爆发的原因,就是数据标准化的问题。数据业务链条上,现在能走通的就是金融和互联网,医疗领域的数据标准化还在建立当中。数据标准化程度高,才更容易产生深度的应用。第三,金融和政务两个领域的公司,发展最快、体量最大。根据我们的调研,2017年,像TalkingData、同盾科技、百融金服等公司,他们的确认收入都已经超过了1亿人民币,而1亿人民币收入是企业服务公司一个很大的门槛。通用技术领域,我们会去关注那些有机会切入到行业应用的公司。BI与可视化、用户行为分析、AI平台等领域,直接面向客户的应用问题,更有机会切入到行业应用。比如用户行为分析里面的神策数据、GrowingIO等公司,第一个直接的方向是营销大数据,这样以来会从原本工具软件这个比较小的细分市场,跳入到营销市场,而我们知道,整个营销市场是万亿级的市场,占GDP的2-3%。数据服务市场,我们也会看它和行业应用的结合,我们判断纯粹的数据交易公司机会有限,第一方平台将逐步崛起,这背后有几个原因:第一, 政策方面,2017年安全法的发布,对数据隐私、数据合规性的要求大大提升,这会对第一方数据公司是个利好,但第三方数据公司的业务受到很多限制。行业标杆客户也更愿意与有品牌、合规的公司合作。第二, 数据既然要和应用去结合,那么就需要热数据,能够持续不断更新的数据,第一方数据公司更容易实现这一点,因此数据本身就是他们业务不断产生的。对第三方公司来说,汇聚多方数据,持续更新的成本较高。基础平台市场,我们认为新需求带来的增量市场更值得关注。基于行业应用、数据分析产生的需求,也就是分析型数据库的市场。交易型数据库市场进入门槛太高,替代银行等头部客户生产环境下的数据库非常困难,这里面存在着数据丢失等风险,这是大企业很难接受的。而分析型数据库基本都是搭建在离线场景,不存在这方面的风险。这个市场目前是100亿,我们判断2020年会到150-200亿,主要的增量来自分析型数据库。全球基础平台市场规模是460亿美金,这里面50-60%是交易型数据库,40-50%是分析型数据库,但国内的分析型数据库只有10%的份额,未来渗透率还有很大的提升空间。扫码关注“大数据栋察”回复“大数据报告”即可获得完整版报告。【阅读推荐】四倍农业|猪联网 |数字富平军民融合|数人计划|数字中国数字生态论 | 数字经济要素的重构 | 联盟使命