欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
国产数据库行业研究与投资机会:宽赛道、高壁垒、新机遇得之也生

国产数据库行业研究与投资机会:宽赛道、高壁垒、新机遇

如需报告请登录【未来智库】。一、全球产业变局已至,数据库上云成新战场1.1、信息爆发式增长,数据库持续迭代升级 信息体量快速增长,数据库行业景气度持续提高。2018 年 11 月 IDC 白皮书《DataAge 2025》指出,全球数据量总和将从 2018 年的 33ZB 增至 2025 年的 175ZB,信息数据呈快速增长态势。与此同时,随着联网人数持续上升,国内数据体量在未来 7 年将实现复合增速 30%以上的快速增长,并在 2025 年成为与欧洲、中东、非洲、亚太和美国等地区相比体量最大的区域。数据激增促使越来越多的企业正视数据存储、管理与安全,IT 成本成为企业必须面对的问题。此外,数据的爆发式增长、云计算的快速推进、互联网安全事件的频发和全球保守主义的兴起等一系列现实问题都不断推动数据库向前进一步发展。当下,分布式数据库与云数据中心正成为数据新的存储方式。根据 IDC 数据,至 2025 年,全球 49% 已存储数据将存在公共云中。数据库(Database),是指按照数据结构来组织、存储和管理,并且可共享的数据集合软件。随着计算机与网络通信技术的不断发展,数据在组织与管理方面不断地面临着新的形势与挑战,同时也推动着数据库架构与技术不断升级迭代。从上世纪 50 年代,UNIVAC 商用电脑的打孔式存储,到 IBM 推出关系型数据库模型理论;从 Oracle 数据库成立并一家独大,到云计算时代数据库上云成为趋势,数据库在过去 70 年经历了数次变革与洗牌。根据产品形态与模式的不同,可将数据库发展分为 4 个阶段。阶段一:从穿孔卡片,到网状与层次数据库变迁。70 多年前,负责数据处理的主要是物理穿孔卡片。1951 年,第一台商用电脑 UNIVAC 交付至美国人口普查局,当时的数据管理,是通过对所有穿孔卡片上的穿孔情况进行操作,以达到储存和处理目的。1956 年,IBM 生产了第一个磁盘驱动器,驱动器装备 50 个盘片,直径2 英尺,储存 5MB 数据。磁盘驱动器的出现,标志着数据存储进入随机存取时代。在此基础之上,陆续诞生了网状数据库 IDS 和层次数据库 IMS。阶段二:确立标准,关系型商业数据库全面推广。1970 年 IBM 研究员 E.F.Codd在论文中提出关系模型概念,为之后 30 年关系型数据库奠定了理论基础,随后诞生了数据库龙头 Oracle、Informix、Sybase 和 SQL Server 等公司。2000 年,全球数据库产业进行了第一轮整合浪潮,并形成 Oracle、Microsoft 和 IBM 三巨头的竞争格局。阶段三:Web 2.0 兴起,NoSQL 数据库应运而生。NoSQL,泛指非关系型数据库。随着 21 世纪初互联网泡沫破灭,新技术与新理念催生出了一批新的互联网巨头,如 Google、Amazon、阿里巴巴和 Facebook 等。与此同时,网络产生的数据量也呈现爆发式增长。传统的关系数据库在应付海量,特别是超大规模和高并发 SNS类的动态网站数量时显得力不从心,为了解决数据爆发带来的挑战,非关系型数据库应时而生,典型代表有如 Hbase、MongoDB、Redis、BigTable 等。阶段四:云计算蓬勃发展,数据库上云成趋势。云数据库是指被优化或部署到一个虚拟计算环境中的数据库,可以实现按需付费、按需扩展、高可用性以及存储整合等优势。云数据库与互联网同时发展起来,是云计算快速推广的产物。2006年,Amazon 推出云服务 AWS(Amazon Web Services),成为全球第一个云计算提供商;2014 年,Amazon 推出 Aurora,一种同时与 MySQL 和 PostgreSQL 兼容的云关系型数据库;2007 年 10 月,Google 与 IBM 开始在美国众多大学推广云计算;2015 年,BigTable 正式亮相 Google Cloud Platform,发力云数据库。1.2、云计算快速发展,奠定数据库上云趋势 作为核心基础软件,数据库扮演着计算关键角色。数据库上游是计算机硬件设备和软件等产品,包括大型机、微型机、存储设备、交换机、路由器和物联网感知设备以及操作系统、BIOS 等软件产品;下游则是广泛涉及的政企用户,如政府、金融、能源、教育和交通等领域。作为数据存储管理软件,数据库在基础软件领域具有与芯片、操作系统同等重要的核心地位。传统龙头根基稳固,云数据库呈崛起之势 。从全球范围来看,传统数据库三大厂商分别为 Oracle、IBM 和 Microsoft。其中,Oracle 又是全球最大,也是应用最为广泛的企业级数据库厂商,一直稳坐行业第一把交椅,甚至拿下中国数据库 40%以上市场份额。然而,随着数据量不断激增,基于开源与分布式的云数据库应运而生,快速冲击着传统数据库的市场格局。根据 Gartner 数据显示,在 2013 年Amazon AWS 推出自研数据库产品 Aurora 之后,旗下的云数据库市场占有率不断提升,并在过去三年维持在市场第一的水平。此外,Microsoft 与阿里巴巴也悉数跻身全球云数据库前 3 名。开源社区与分布式架构,奠定云数据库发展基础。开源数据库作为开源社区产物,其源代码具备全球共享、免费等特点,开发者可在其源码中修改或使用,其中MySQL、PostgreSQL、MongoDB 和 Redis 是当前开源数据库最为重要的参与者。而商业数据库是由企业开发和维护,必须通过授权订阅才能使用,但不能修改,如 Oracle、SQL Server 和 DB2 等是主流商业数据库厂商。2019 年,前三大开源数据库市占率为 57.3% ,前五大占有率为 76.8%,市场高度集中,而其中占据第一位的 MySQL 使用量超过 30%,并持续多年占据排行榜第一。加州大学计算机系开发的 PostgreSQL 排名第二,用户占比达 13.4%,MongoDB 排名第三,市占率为 12.2%,此外紧随其后的是 Redis(非关系型) 、 MariaDB 、 Elasticsearch 、Cassandra 和 SQLite ,前后之间差距较小,竞争较激烈。从集中式到分布式,令云数据库成为可能。分布式数据库是指通过中小型机联接,实现与集中式数据库同等性能的数据库软件。通过扩展或收缩服务器数量,分布式结构可实现性能与服务的弹性变化,大幅降低大型机高性能要求和高昂经济成本,并极大提高数据库的容错性与拓展性,以实现全局逻辑上集中、物理上分布的管理逻辑。根据中国制定《分布式数据库系统标准》,系统可抽象为 4 层结构模式,对应全局外层、全局概念层、局部概念层和局部内层,在各层间还有相应层间映射。1.3、国产化趋势明确,数据库迎信创大机遇 中国数据库市场仍处于快速成长期,国产数据库占比较低。根据智研咨询,2012年我国数据库软件市场规模为 53.15 亿元,2018 年增长至 139.25 亿元,过去 6年复合增速 17.4%。考虑到信创产业发展与服务器出货量触底反弹,未来数据库市场有望迎来新一轮快速增长。假设行业复合增速为 17.4%,则 2020 年国内数据库市场规模有望达到 200 亿元。2017 年,国产数据库产品市场规模为 17.15 亿元;国外产品市场规模 103.07 亿元,占比 83.36%。国产数据库市场份额从 2009 年 4.19%增长至 2017 年 16.64%,国产品牌适配与替换进程加速推进。当前,国内厂商的客户主要集中在政府、国有企事业单位,市场渗透率仍处于一个较低水平。潜力巨大,国外大厂长期垄断国内数据库市场。Oracle、IBM 和 Microsoft 等老牌厂商凭借先发优势在市场份额中占据了有利地位。国产数据库起步较晚,且由于数据库的技术壁垒高,中国在基础软件市场,尤其是数据库领域,仍长期被国外巨头所垄断。2017 年,Oracle、IBM 和 Microsoft 三家厂商占据国内市场近六成份额,其中,Oracle 占据了数据库管理系统 40.1%;IBM 居其次,市场份额为 11%;Microsoft SQLServer 以 8.3%的市场份额位居第 3 。全球数据库为欧美垄断,国产化大势所趋。传统的 IT 架构以 IOE 为主导,IOE 是指 IBM 大型机、Oracle 数据库、EMC 存储设备,是传统大型企业必不可缺的信息化产品。2008 年,在面对高额的支出下,阿里巴巴率先提出“去 IOE”概念,剑指 IT 架构,并通过使用开源软件以及分布式云数据库代替 IBM 大型机、Oracle数据库和 EMC 存储设备。2013 年,阿里基本完成核心系统“去 IOE”工作,历时8 年,成为中国企业界走上“去 IOE”的先驱。一叶扁舟到百舸争流,传统国产数据库历经长时间艰难探索。除了互联网科技巨头,传统国产数据库也经历了很长时间的去 IOE 进程。根据产业发展,可将数据库发展分为四个阶段:阶段一:1992 至 1997 年,达梦数据库与多媒体研究所在武汉成立;1996 年,达梦 DM2 发布并应用于国家电力财务公司;阶段二:1997 至 2000 年,中国数据库行业格局基本形成,IBM DB2、Informix与 Oracle 占据金融、电信、交通与能源等各个行业;阶段三:2000 至 2013 年,数据库产品研发和应用示范受益国家政策,众多厂商不断涌现,如人大金仓、南大通用、瀚高、神舟通用和优炫等;阶段四:2013 年至今,棱镜门事件发生,政策红利推动国产数据库持续扩张。二、数据库行业大洗牌,未来云化成致胜要素2.1、上云成大势所趋,新兴数据库云端飞跃 数据库系统持续演进,拉动百亿美元软件市场。至 2023 年,预计 75% 数据库都将实现上云,这一变化将彻底改变数据库系统供应商格局,Oracle 等传统数据库厂商也将受到挑战。2018 年,数据库全球市场规模达 461 亿美元,同比增长 18.4%,其中云数据库贡献 104 亿美元,占全球数据库市场 22.56%,为行业增长贡献 68%。伴随云计算出现的云数据库形态,给中国数据库厂商突破全球旧有格局提供机会。云数据库按需扩展、按需计费特征使其获得了中小企业及互联网用户拥趸,这又进一步推动云数据库技术发展,形成正反馈。在企业全面上云的背景下,传统数据库上云模式无法满足客户业务快速扩展和智能运维的需求,而灵活伸缩、智能诊断、支持跨云融合的新一代云端原生数据库系统,就成为未来发展的重要方向。数据库发展正从“数据库+云”模式全面转向“云+数据库”模式。根据 Gartner 数据,2019 年全球云计算市场进一步向头部集中,Amazon、Microsoft、阿里云、Google、IBM 位列 2019 年全球云计算市场前五名。其中,Amazon、Microsoft 和阿里云占据市场七成份额。Amazon 排名依旧领跑,不过,其市场份额已从 2018 年 47.9%下滑到 2019 年 45%,其云计算收入增速也低于Microsoft、阿里云和 Google。云原生数据库大势所趋,“云+数据库”贡献行业主要增长点。数据库的未来必然上云,目前云数据库已经为数据库市场贡献一半以上收入增长。云数据库天然具备云灵活性,能够提供强大的创新能力、丰富多样产品体系、经济高效部署方式和按需付费的支付模式。与传统数据库不断放缓的收入增速相比,云数据库正在实现快速增长。从全行业角度,2010 年至 2018 年,Oracle 稳居全球第一;同时,深度布局云数据库的厂商 Amazon、Google、阿里巴巴、华为和腾讯等新进入者,则在市场规模上快速攀升。2013 年以来,Amazon Aurora 从发布到全球第三,仅用了 6 年时间;阿里巴巴云数据库 2014 年推出,位居全球第 26 名,至 2018 年排至全球第 9 仅用了 5 年时间;同时,华为与腾讯分别在 2015 和 2016 年推出相关产品,至 2018年,已经分别居于全球排名 11 名与 13 名,云数据库厂商发展迅速。2017 至 2018 年,整个数据库市场增长了 18.4%,其中云数据库增长贡献 68%,AWS与 Microsoft 贡献其中 75%,二者产品增长均来自于云。此外,2018 年,阿里云位居全球云数据库市场第 3 位,年增速在 115%。云数据库的快速发展,极大地重塑了全球供应商格局。国内互联网科技巨头,纷纷布局数据库产业,借力云计算实现数据库等基础软件领域的迭代与超越。2014 年,阿里云率先孵化原生数据库 PolarDB,并于 2017年正式发布;华为数据库研发始于 2007 年底,2012 年成立 Gauss 实验室,2014年孵化第一个 Gauss OLAP 产品,并于次年在工商银行内部上线;腾讯云数据库始于 2016 年,并于 2018 年发布首款自研云原生数据库 CynosDB。至 2018 年末,三家公司均跻身进入全球数据库前 15 名排行榜。2.2、阿里率先去 IOE,引领亚太数据库上云 2008 年,阿里巴巴率先提出“去 IOE”,剑指 IT 架构,用开源软件及分布式云服务器代替 IBM 大型机、Oracle 数据库和 EMC 存储设备。随着国产 IT 基础软硬件的不断发展,“去 IOE”已经由一个企业的目标成了整个行业的目标。2013 年,阿里基本完成了核心系统“去 IOE”工作,历经 8 年,成为中国企业界走上“去 IOE”的领头羊,而 Oceanbase 和 PolarDB 则是阿里(阿里云与蚂蚁金服)数据库的典型。金融级分布式关系型数据库,专注服务交易行业。2010 年,蚂蚁金服、阿里巴巴正式推出自主研发的金融级分布式关系型数据库 OceanBase,该数据库具有数据强一致、高可用、高性能、在线扩展、高度兼容 SQL 标准和主流关系型数据库、低成本等特点,一经推出,即在金融领域实现快速扩张。如今,OceanBase 已成功应用于支付宝全部核心业务:交易、支付、会员和账务等系统以及淘宝等业务。除此之外,2017 年始,OceanBase 也开始服务外部客户,包括南京银行、浙商银行、印度 Paytm 和人保健康险等。技术上,OceanBase 采用 Share-Nothing 架构,实现各个节点之间完全对等,每个节点都有自己的 SQL 引擎和存储引擎,在整个设计里没有任何单点,从架构上解决了高可靠和高可用问题。阿里云进军云数据库,PolarDB 带来数倍性能提升。PolarDB 是阿里云 2017 年 9月推出的自研下一代关系型云数据库。数据库有三个独立的引擎,分别可以 100%兼容 MySQL、100% 兼容 PostgreSQL、高度兼容 Oracle 语法,存储容量最高可达100TB,单库最多可扩展到 16 个节点,适用于企业多样化的数据库应用场景。PolarDB 既融合了商业数据库稳定可靠、高性能、可扩展等特征,又具有开源云数据库的简单开放、自我迭代优势,如 PolarDB MySQL 性能最高可以提升至 MySQL的 6 倍,而成本只有商用数据库的 1/10,极大地提高了使用弹性。积极突破,成功进入“挑战者”象限。在 Gartner 公布的 2019 年全球数据库魔力象限中,阿里云成功由 2018 年的“观察者”进入到“挑战者”象限,成为连续两年上榜的唯一一个中国企业。2018 年,阿里云已位居全球云数据库市场份额第 3位以及中国市场第 1 位,年增长率达到 115%,营收规模是第 2 名厂商的 2 倍,同期 AWS 增速为 74%、Oracle 为 66%。与 2018 年相比,数据库魔力象限还出现了一定变化,Oracle、Microsoft 等传统数据库公司仍然是领导者,但是今年 IBM 从“领导者”象限滑落至“远见者”象限,阿里云、Google 则表现更为突出。2.3、腾讯发力银行端,首度进银行核心系统 2010 年,腾讯首次开放云计算功能,正式对外提供服务。2011 年 2 月,腾讯云数据库、NoSQL 高速存储上线;2013 年,腾讯云面向全社会开放、云安全上线,公司云计算进入快速发展期。根据 Gartner 统计,2018 年,腾讯云数据库市场份额增速达 123%,位列国内所有数据库厂商之首,在全球范围内连续两年保持增速前 3 势头。此外,Forrester 也在全球数据库评估报告中,给予腾讯云数据库“实力竞争者”评价。腾讯云数据库平台涵盖各类产品,包括关系型与非关系型,分布型与分析型等适应各类应用场景的数据库产品,包括开源数据库 MySQL、MariaDB、MongoDB、Redis;商业数据库 Oracle、SQL Server;也包括自研数据库 TDSQL、TBase 等,满足 OLTP、OLAP 及 HTAP 等多场景需求。同时,2018 年,腾讯云还结合新硬件和云特性推出计算和存储分离的 NewSQL 国产自研数据库 CynosDB,100% 兼容 PostgreSQL 和 MySQL 协议。落地张家港,国产数据库首次迎来金融核心领域突破。2019 年,腾讯云新一代分布式数据库 TDSQL 落地张家港农商行,银行传统核心系统首次实现数据库国产可控,TDSQL 助力张家港农商行实现“降本增效”,实现 75% 以上的硬件投入成本缩减,节省超过 20% IT 投入。在传统银行之外,TDSQL 也已经部署在腾讯云与微众银行打造的全球首家云上银行系统中,运营后,系统成本比传统银行节约 50%以上;单 IT 运维户均成本也不到传统银行的十分之一。快速扩张,腾讯云数据库支撑数十万计企业用户。腾讯云数据库目前已经为数十万企业级用户提供服务。腾讯内部众多产品包括 QQ、微信、财付通、视频、新闻和游戏等背后都使用了腾讯云数据库。更多企业在实现核心业务系统时使用腾讯云数据库,如小红书、猎豹、微众银行、蘑菇街和猫眼等等;在应用场景上,公司产品也已经全面覆盖了电商、金融、游戏等行业。2.4、华为十年磨一剑,打造智能异构数据库 企业级 AI-Native 分布式数据库,支持 AI+异构计算。高斯数据库(GaussDB)是华为2019年5月正式推出的商业数据库,产品包括GaussDB OLTP和GaussDB OLAP,产品主要应用于金融、政府、能源和电信等行业,可以满足高并发事务实时处理、海量数据高效分析等需求。GaussDB 数据库采用 MPP 架构,支持行存储与列存储,提供 PB 级别数据量的处理能力,可以为超大规模数据管理提供高性价比通用计算平台,也可用于支撑各类数据仓库系统、BI 系统和决策支持系统,为上层应用的决策分析提供服务。此外,产品还将 AI 能力植入到数据库内核架构和算法中,为用户提供更高性能、更高可用、更多算力的分布式架构与能力。异构计算,GaussDB 数据库支持 X86、ARM、GPU 和 NPU 等架构。与传统 X86 架构数据库厂商 Oracle、Microsoft 不同,GaussDB 除了支持 X86 架构,还支持 ARM、GPU 和 NPU 等芯片架构,可以建立在华为鲲鹏架构之上,包括网络设备、芯片、操作系统、云计算和人工智能等,实现闭环生态高度耦合。异构计算为华为走差异化路线和国产服务器奠定了技术储备优势。截至 2019 年 11 月,华为数据库产品全球累计发货超过 30000 套,广泛应用于多个行业,其中,又以银行最具有代表性。从信息安全角度,国产数据库对于中国各行各业意义重大。2015 年,GaussDB OLAP 在工商银行上线;2018 年,又陆续在招商银行部署上线,包括综合支付交易、信用卡重资产营销、金融科技类项目,包括“手机银行”、”掌上生活”,也包含金融科技类创新业务。至 2019 年底,已经有超过 17 套招行生产业务在 GaussDB 数据库上线投产,覆盖核心、渠道、零售、对公、同业、风险、信用卡和数据仓库等领域。联合用友,产业互补,大力开发鲲鹏产业生态发展。2019 年 8 月,用友网络与华为签订合作协议,基于用友企业云服务和华为 GaussDB 数据库打造领先的联合解决方案,共同推进构建鲲鹏国产计算生态。双方将协同完成大型企业数字化平台NC Cloud 等产品对 GaussDB 数据库的适配。用友和华为在企业服务上具有高度的互补性,双方技术、产品与服务能够进行深度融合。华为分布式 OLTP 数据库 GaussDB,采用鲲鹏处理器,使得故障恢复在数秒内即可完成,且支持单机、分布式和两地三中心三种部署模式,可以满足企业核心应用诉求。作为高性能企业级数据库,GaussDB 数据库可以有效应对 5G、IoT和移动互联网带来的井喷式数据增长,单机可达 150 万 tpmC,分布式部署实测达千万级 tpmC。三、信创产业迎大时代,国产数据库异军突起3.1、百家争鸣,传统数据库厂商蓬勃发展 从国产数据库“四小龙”,到产业百花齐放。经过近 30 年的发展,国产数据库已经形成了以武汉达梦、人大金仓、南大通用和神舟通用“四小龙”为代表的,以阿里、腾讯和华为科技巨头为代表的,以科蓝软件外延并购 SUNJE SOFT 厂商切入数据库赛道为代表的,以及百余家新兴数据库厂商采用开源参与的竞争格局。其中,武汉达梦、南大通用等企业厂商年销售额均在亿元以上。2018 年,在中国 IT 年会上,南大通用拿下 2017-2018 中国国产数据库市场年度占有率第一,实现市占率第一的“五连冠”;武汉达梦获得了“国产事务性数据库市场占有率第一”。人大金仓和武汉达梦在政府行业占据了前二的市场份额。国产传统数据库多在政务市场,政策驱动提高行业景气度。我国数据库需求市场主要在消费品、装备、政府采购领域,其中消费品领域数据库 2017 年需求达到20.76 亿元,装备 18.24 亿元,政府采购 13.75 亿元。国产数据库受益政策较多,在“新基建”及信创产业政策推动下,未来 3-5 年有望迎来一个快速迭代与发展过程。2017 年,我国国内主要数据库企业南大通用营业收入为 3.05 亿元,占同期国内数据库市场总规模 2.54%;武汉达梦营业收入 2.26 亿元,占比 1.89%;山东瀚高收入 0.80 亿元,占市场份额 0.67%;爱可生营业收入 0.74 亿元,占比 0.62%;人大金仓营业收入 0.55 亿元,占比 0.46%,国产数据库市场渗透率有望进一步提升。则信创市场空间在保守、中性与乐观假设下,数据库国产化的潜在市场空间分别为 108、268 和 428 亿元。3.2、武汉达梦:全面自研国产数据库厂商 武汉达梦数据库有限公司(“武汉达梦”)成立于 2000 年,专业从事数据库管理系统的研发和销售等业务。是中国电子信息产业集团(CEC)旗下重要基础软件公司,大股东中国软件持有公司 25.21%股权。武汉达梦采用“销售产品+技术服务”盈利模式,目前已经掌握数据管理与分析领域的核心前沿技术,是国内少数拥有全部源代码,具备完全自主知识产权和产品线最全的厂商之一。2019 年,公司实现营业收入 2.72 亿元,同比增长 25.41%;净利润 0.57 亿元,同比增长 93.57%,连续两年实现净利润快速增长。2012 年至 2019 年,武汉达梦实现收入较快增长,复合增速 14.06%;净利润整体呈上升趋势,复合增速 73.3%;除 2014 与 2016 年亏损,其它年份均实现盈利,且近两个净利润呈现加速增长趋势,原因主要系国产化与信创产业需求放量。立足武汉,辐射全国做强做大。公司以武汉总部为中心,在全国建立了北京、华北(沈阳)、西北(西安)、西南(成都)、华中(武汉)、华南(广州)和华东(上海)等 7 个技术服务中心,具备全国综合性服务及解决能力。此外,公司拥有稳定的市场营销渠道和技术服务网络,产品已覆盖政府、电力、通信和金融等 30 多个关首国计民生的行业,当前已经进入金融、社保、民航和电力等高端应用领域核心交易系统。此外,武汉达梦在泰国、印尼和津巴布韦等东南亚和南美市场也取得了一定突破。截至 2019 年,武汉达梦拥有员工规模超过 700 人,根据公司披露信息,2015 至2017 年,公司技术研发人员占达梦总人数为超 50%,每年研发投入收入占比超过25%,具备较高水平研发能力3.3、人大金仓:国内最早的数据库拓荒者 1999 年,人大金仓由中国人民大学最早一批数据库教学和研发的专家发起创立。与达梦数据库一样,公司采用“销售商品+技术服务”商业模式。公司产品主要应用于电子政务、国防军工、电力和金融等超过 20 个重点行业,完成装机部署超50 万套,遍布全国近 3000 个县市。背靠 CETC,打造信创产业链重要环节。人大金仓背靠中国电子科技集团有限公司(CETC),是集团旗下上市公司太极股份的重要参股子公司。公司主要客户集中在电子政务、党务、国防军工、金融、智慧城市和企业信息化等领域,在北京、上海、成都和天津等地都设有研发和服务中心,在全国设有分公司、办事处及代理合作机构。2017 年 5 月 18 日,太极股份对人大金仓增资 5000 万元,持股比例由 32.74%上升至 38.18%,成为人大金仓第一大股东;2017 年 4 月 16 日,南天信息对人大金仓增资扩股 3000 万元,持股比例 11.70%;2019 年,人大金仓业务迅速增长,全年新签合同总额增幅超过 100%;2019 年 8 月,人大金仓成功中标 2019 年央企软件联合采购项目,中标金额高达 1342 万。2019 年,人大金仓实现营业收入 0.85 亿元,同比增长 37.3%;净利润 378 万元,同比小幅增长。2012 年至 2019 年,公司整体业绩较为平稳。2015 年至 2017 年,人大金仓的技术人才占比为 21.56%。3.4、GOLDILOCKS:高端内存数据库新星 外延并购,拓宽国产高端传统数据库能力圈。SUNJE SOFT 是一家致力于研发内存分布式数据库产品的成熟韩资企业,产品在高并发、实时交易的数据处理领域具有突破性的创新和优势。2018 年 12 月,北京科蓝软件系统股份有限公司(以下简称“科蓝软件”)香港全资子公司科蓝软体系统(香港)通过现金 7300 万元人民币收购 SUNJESOFT 株式会社 67.15% 股权,完成对分布式内存数据库GOLDILOCKS 的收购。GOLDILOCKS 分布式数据库具有支持高并发、实时交易的处理能力,在海量数据处理方向具有突破性技术,可以彻底解决传统磁盘数据库的性能瓶颈问题,显著提升业务系统处理能力。在产品设计上,GOLDILOCKS 具有分布式计算、可扩展性和基于内存计算等特性,同时保持了对传统技术良好的兼容性,如 ACID 和 SQL 的支持,其高并发、低延时、高可用及支持复杂数据模型的特点,并适用于电信、金融等对实时性要求较为严格要求的场景。此外,产品没有采用 MySQL 或 PostgreSQL 等相关内核技术,因此可有效规避潜在的知识产权和信息安全隐患,不受国际形势变化因素影响。在国产化生态建设工作中,GOLDILOCKS 已经完成了国产处理器、操作系统及中间件的兼容适配工作,其中,芯片方面已经与 ARM 架构的鲲鹏、飞腾完成适配;操作系统层面与 UOS、麒麟适配;中间件与国产主流东方通、中创和金蝶完成适配,具备作为信创数据库产品的能力与条件。四、投资建议与相关标的4.1、中国软件公司是中国电子(CEC)旗下网络安全与信息化板块的核心企业。中国软件拥有包括操作系统、中间件、数据库等基础软件、安全产品、应用系统等较为完善的安全创新产业链。传统国产操作系统龙头,信创产业重要一环。公司旗下参股 25.21% 子公司武汉达梦是当前传统国产数据库中最为具代表性的稀缺产品,武汉达梦主营业务为关系型数据库,其核心源码属于 100% 自研。4.2、太极股份公司是中国电科(CETC)旗下网络安全与信息化板块的核心企业。太极股份是国内电子政务、智慧城市和关键行业信息化的领先企业,通过 CETC 集团间整合,公司打造了云服务、网络安全与自主可控、智慧应用和系统集成服务的业务结构体系。2020 年 3 月,公司控股股东十五所将其 33.20%股权无偿划转至中电太极(集团)并将表决权委托给中电太极,通过改革,企业活力得到进一步激发。CETC 核心资产,人大金仓打造国产数据库龙头。公司旗下参股 38.18% 子公司人大金仓是传统国产数据库“四小龙”之一,公司主营业务为关系型数据库,在政务领域拥有高识别度与市场占有率。4.3、科蓝软件公司成立于 1999 年 12 月,是国内领先的银行 IT 解决方案供应商。公司主营业务是向以银行为主的金融机构提供软件产品应用开发和技术服务、IT 咨询、规划、建设、营运、产品创新以及市场营销等解决方案;同时公司积极拓展保险、证券、大型央企国企、金融控股企业等非银金融机构。2018 年 12 月,公司香港全资子公司科蓝软体系统(香港)通过现金 7300 万元人民币收购 SUNJESOFT 株式会社67.15% 股权,完成对分布式内存数据库 GOLDILOCKS 的收购,布局信创超高性能的分布式内存数据库。科蓝软件与公安部三所、华为钱包合作,推出手机柜台系统;基于华为 HMS 手机钱包提供的最高安全等级移动终端可信执行环境(TEE);为数字货币体系的全线上化运行提供更可靠、更权威的 KYC 工具,落实数字货币在交易环节的反洗钱、反恐怖融资等政策要求的客户身份验证,保障数字货币体系安全运行等。……(报告观点属于原作者,仅供参考。报告来源:兴业证券)如需报告原文档请登录【未来智库】。

皇极

数据库行业深度报告:历史机遇,国产数据库市场迎来十倍空间

如需报告请登录【未来智库】。一、数据库行业的基本情况(略)1.数据库的性能:六个方面,一套标准数据库的性能指标聚焦于 6 个方面:吞吐量、负载均衡、读写速度、分区分片、并发性和可用性。不同类型的数据库由于使用场景的差异,在性能和功能上有不同的偏重,在这六个指标方面同样会有所差异。常见的具体指标有平均每秒响应速度、查询速度、平均每秒吞吐量等。TPC 是国际上最流行和广泛接受的数据库性能标准测试。TPC(事务处理性能委员会)是由十几家会员公司创建的非盈利组织,总部设在美国。TPC 的成员主要是计算机软硬件厂家,主要功能是制定商务应用基准程序的标准规范、性能和价格度量,并管理测试结果的发布。针对不同类型数据库之间的区别,TPC 颁布了对于数据库在线事务处理(OLTP)能力测试的基准程序 TPC-C 和在线分析处理(OLAP)能力测试的基准程序 TPC-DS。TPC-C 测试中的 tpmC 值(TPC-C 测试过程的吞吐量,按有效 TPC-C 配置期间每分钟处理的平均交易次数测量),在国内外被广泛用于衡量数据库系统的事务处理能力。根据 TPC-C 最新排名,蚂蚁金服自研的OceanBase 数据库 tpmC 值达到 707,351,007,成功超越之前的记录,击败 Oracle 和 IBM 的数据库,登顶榜首。2.国内数据库市场现状:国产化持续推进,关系型数据库为主导当前我国数据软件市场具有百亿以上市场规模,持续受益大数据产业发展。根据智研咨询数据显示,2017 年我国的数据库软件整体市场规模为 120.22 亿元,12-17 年的行业复合增速超 17%,处于稳健发展期。根据 2019 大数据白皮书,2019 年大数据研发人员超过 8 万人,研发投入超过 550 亿人民币,同时预计我国 2020 年大数据产业市场达 6600 亿元以上,行业复合增速超 20%,数据软件细分市场作为产业重要构成持续受益产业发展红利。传统关系型数据库仍为主流,市占率超 85%。当前数据产业发展下的海量数据导致大量非关联数据分析需求的产生,导致关系型数据库占比的下降。但参考国外数据库的发展和国内数据库市场当前情况,传统关系型数据库仍占主导,国内市场规模从 2012 年的 46.51 亿元增长到 2017 年的 102.8 亿元,复合增速为 17%,略高于行业增速,市占率超 85%。国产化替代持续推进,关系型市场中国产数据库市占率从 2009 年的 4.2%提升至 2019 年的 18.9%以上,海外四巨头仍占据 65%以上份额,海外厂商整体增长乏力。自 10 年前后提出“去 IOE”和 13 年棱镜门事件影响后,我国一直在推动国产数据库持续扩张,国产市占率从2009 年的 4.2%提升至 2019 年的 18.9%以上,但近 3 年海外四巨头在国内市占率仍维持在 65%以上份额,因而当前海外巨头的影响力仍在,国产化仍有较大提升空间。国内数据库市场面临新入跨界巨头的竞争,南大通用、人大金仓和武汉达梦等传统数据库公司份额有所下降。华为、阿里 2019 年起将自研数据库推入市场并进行大力的商业推广,加剧国内数据库市场竞争。根据 IDC 的数据,2019 年国内传统部署的关系型数据库市场中,华为数据库以 6.2%的市场份额位列第五,排在 Oracle、Microsoft、IBM、SAP 之后;阿里巴巴以 5.8%的市场份额位列第六;而传统数据库厂商南大通用和人大金仓分别以 4.2%和 2.7%的市场份额排在第七、八位当前云部署已成为国内关系型数据库新方式,国内数据库云化率持续上升。根据 IDC 数据,2019 年中国关系型数据库传统部署模式的市场规模为 7.9 亿美元,公有云模式市场规模为5.5 亿美元,同比增速 30%。其中,2019 年阿里巴巴在公有云关系型数据库市场中以 48.1%的市场份额排名第一;腾讯以 20.4%的市场份额排名第二,AWS 以 10.4%的市场份额排名第三;随着企业数智化转型和数据上云的持续,未来 3 年国内数据库采用云部署的市场增速将超过关系型整体市场 23.2%的行业增速。二、以史为鉴:行业与巨头发展史1.数据库行业发展史:穿孔卡片、关系数据库、非关系数据库到云数据库(略)2.Oracle 发展历程:市场领导者是怎样诞生的(略)复盘 Oracle 的崛起历程,可以发现技术驱动和行业垂直整合是 Oracle 发展历程最重要的两个因素。每次行业变革发生时,Oracle 始终走在最前面,成为市场的领导者,凭借自身的技术优势和优秀的产品击败对手。如今,云数据库概念的兴起,行业再次进入到技术变革期。在这次技术浪潮中,中国厂商与国外厂商一起走在前面,抓住云数据库的发展趋势,有机会实现弯道超车,扩大、巩固行业地位。此外,行业通过收购方式打造垂直生态链,提供完整解决方案,更有希望获取优势,击败竞争对手。三、数据库行业的未来1.数据库行业的发展方向:云数据库、非关系型数据库、内存数据库与流数据库 云数据库、非关系型数据库、内存数据库、流数据库是当前数据库行业发展方向。云数据库降低企业成本的同时为企业提供更加方便的云服务;非关系型数据库在互联网背景下比关系型数据库有更好的表现;内存数据库更能满足当今企业和用户对快速读取的需求,流数据库在内存数据库的基础上加强数据库的实时分析和流量监控能力。这四种数据库成为数据库行业的新方向、新动力。云市场快速增长,数据上云成为趋势。云数据库并非是一种全新的数据库模型,而是选择以服务的形式向用户提供数据库功能。不同规模企业对云数据库的需求不同:对于大型企业,云数据库可以满足海量数据存储需求;对于中型企业,云数据库可以满足数据存储动态变化的需求;对于小型企业,云数据库可以满足低成本数据存储的需求。Gartner 认为,数据库的未来必须云化,目前云数据库已为数据库市场的增收贡献一半以上份额。与传统数据库不断下降的营收相比,云数据库正在积极地快速增长。到 2022 年,预计有 3/4 的数据库天然部署或迁移到云上。Gartner 表示,企业正将新应用向云转移,对数据存储和计算分析的能力要求不断加强。相比传统数据库,云数据库天然具备灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式。非关系数据库比重提升,关系数据库保持市场主体地位。近年来,数据增速集中于物联网设备、影音文件、网站日志、社交信息等,这些数据具有海量、低信息密度的特点。非关系数据库易于扩展、无序存储、分布式架构的特性,相比传统的关系型数据库,更能满足对这些数据的储存需求。虽然关系数据库的市场份额和增速受到非关系数据库崛起的影响,但关系数据库成熟的体系和完整的生态将持续为 CRM、REP 和信用卡交易等以结构化数据为主并注重数据安全和一致性的场景提供服务。数据库行业发展的最新趋势表明,关系数据库和非关系数据库的边界逐渐变得模糊。NewSQL 数据库开始兴起,这类数据库不仅具有非关系数据库对海量数据的存储管理能力、高性能数据处理和易于扩展的特性,还保持了传统关系数据库支持 ACID 和 SQL 查询等特性,支持关系数据模型。一些非关系数据库也发生转变,调整数据结构以支持使用 SQL 语言查询。William Blair 认为,数据库未来将是把关系数据库和非关系数据库结合,跟据数据结构、使用场景灵活调节,共同为用户服务。内存数据库得到广泛运用。随着移动互联网发展,信息系统的互动性日益增强、用户规模不断攀升,催生出一大批高并发、低时延的新兴应用。基于磁盘存储的数据库受限于磁盘的读写速度,很难满足低时延与高并发的需求。将数据存储在内存里的内存数据库成为解决传统磁盘数据库问题的主流技术路线。在电子商务、视频直播、电信计费等对响应速度要求极高的场景下,内存数据库大展身手,进入成熟的商用模式。根据 Research and Market 的报告显示,2019 年全球内存数据库市场达到 41.6 亿美元,预计到 2025 年将增长至 118.2 亿美元,复合增长率达到 19%,远超整体市场每年 8%的增长率,市场前景广阔。流数据库成为新潮流。在内存数据库中,主打事务处理和实时分析结合的流数据库成为新潮流。流数据库是指能实时收集、处理、存储流数据(一组顺序、大量、快速、连续到达的数据序列)的数据库。相比传统数据库分批处理数据,流数据库在对数据完成实时分类、分析、存储等环节,应对海量数据涌入时,仍能保持实时响应和低延迟。流数据库通常采用内存作为数据存储方式,并采用分布式架构,需要高速处理的数据可异步快速加载到处理集群内存中;处理集群可轻易地扩展到数百个物理节点,提升处理速度。流数据库适用于快速响应、实时分析、实时监控等场景。对于企业,依靠流数据库强大的实时数据反馈与商业智能结合,对终端用户数据监控并迅速做出决策,有效提升运营效率并减少决策时间,更好地在商业竞争中取得优势。开源数据库成为更多企业的选择。开源数据库是指源码完全开放,可供大众下载和修改的数据库。常见的开源数据库有 MySQL、PostgreSQL、MongoDB 等。面对价格低廉、性能相等、生态不断完善的开源数据库,昂贵的商业数据库逐渐失去市场优势。根据数据库权威排名 DBEngines 数据显示,截至 2019 年开源数据库和商业数据库已平分秋色,考虑到大部分云数据库采用开源架构,随着开源数据库生态不断完善、功能日益丰富,未来开源数据库的市场份额将进一步提升。商业数据库虽然份额持续下降,但这并不意味着商业数据库会退出市场。对于一些注重数据安全性的企业,如银行、跨国公司,商业数据库依旧是一个让人放心的选择。此外,一些长期使用商业数据库的大型企业,如果从商业数据库转变为开源数据库需要复杂的数据迁移,这会影响企业的日常业务。此外,开源数据库如 MySQL、Neo4j 等由于协议的开放性,限制了其他企业商用能力;虽然存在社区贡献者和个人开发者,但社区整体生态和服务支持比商用数据库仍相差甚远。综合来看,商业与开源数据库各有优劣:开源数据库在互联网行业和小微企业很有市场;传统行业和大型企业依旧高度依赖商业数据库。2.国内数据库行业的未来:市场需求、国产替代与云化趋势 国内数据库市场潜力巨大。自 2012 年以来,国内数据库市场迎来蓬勃发展期,进入百花齐放时期。传统数据库厂商和云数据库服务商都在加速产品迭代和推出新的产品。同时,新兴数据库厂商不断涌现,以及其他领域厂商向数据库跨界情况的增多,使中国数据库市场更加繁荣和活跃。根据 IDC 中国的数据显示,2019 年中国关系型数据库软件市场规模为 13.4 亿美元。其中,传统数据库市场规模为 7.9 亿美元,公有云数据库市场规模为 5.5 亿美元,整体市场同比增长 30.8%。IDC 预测,到 2024 年,中国关系型数据库软件市场规模将达到 38.2 亿美元,公有云关系型数据库软件市场规模将达到 25.1 亿美元。信息量爆发式增长,数据库需求提升。IDC 在报告指出,全球数据量总和将从 2018 年的32ZB 增至 2025 年的 175ZB,信息数据呈爆发增长态势。由于中国上网人数的增加以及视频监控设备的普及,加上大数据、移动互联网、人工智能等技术革新和正式投入商用,IDC 认为中国将保持 30%的复合增长率,到 2025 年中国将成为世界上数据量最多的地区。去“IOE”持续推进,本土厂商产品成熟、竞争力提升。“IOE”是指 IBM 的小型机、Oracle 的数据库系统和 EMC 的存储设备及中间件,这些国外厂商设备占据了国内市场的大部分份额。目前国内市场上的数据库系统主要产品仍来自 Oracle、IBM、Microsoft 三大国外厂商,国产数据库产品渗透率低。自从数据与信息安全得到政府和企业重视以来,国产产品在关键领域实现替代成为重中之重。2008 年,阿里率先开始去“IOE”运动,到 2013 年,最后一台 IBM的小型机下线,阿里巴巴彻底完成去“IOE”的计划。在这之后,许多企业和政府机构开展设备国产化的运动,为国产厂商带来新的增长机遇。经过一段时间成长和磨砺后,从性能和功能来看,国产数据库已能覆盖绝大部分数据库使用的场景,在某些细分领域甚至推出性能超越、价格远低于国外产品的数据库解决方案。未来会有更多企业、政府机构和事业单位选择国产数据库作为替代。外部环境压力激增,国产替代进程加速。中美关系自 2016 年贸易摩擦以来持续恶化,中兴通讯、华为、海康威视等企业遭受不同程度的制裁。2020 年 5 月,新一批制裁名单公布,将 33 家机构、企业和个人列入限制名单。随着中美博弈升级,国家对信息技术创新的支持也逐步公开化、透明化。我们预期信创产业采购将于 2020 年下半年开始落地,我们认为国产数据库的替代需求将释放,国内企业有望持续受益政策和行业双重红利。我们根据政府机关人数、事业单位人数和国有企业职工人数推算接下来 5 年内国产数据库的市场情况。假设不考虑民用消费市场,根据《2018 年财政年鉴》、《2018 年国有资产监督管理年鉴》显示,2017 年我国政府机关人数、事业单位人数、国有企业员工人数分别达到 1300万、3150 万和 6000 万人,分别按照人均配置 1 台、0.7 台、0.4 台电脑计算,并按照 15 台、15 台、20 台电脑配置 1 台服务器、5 台服务器配置 1 套数据库,一套数据库采购价分别为 12万、10 万和 12 万,计算得出政务市场、事业单位和央企国企整体市场规模分别为 208 亿、294亿、288 亿。考虑当前已有 20%的市场份额为国产数据库,因而若完全全部替代,则整体替换市场空间为 163 亿、233 亿、230 亿,合计 626 亿;保守估计只完成 50%的替换,则新增空间为 61 亿、87 亿、86 亿,合计 235 亿。我们预计数据库的国产采购于 2020 年开始,到 2024 年完成全部采购,每年采购项目分别占整体市场规模的 20%、30%、25%、15%、10%,算得 2020-2024 市场采购规模分别为 156亿、235 亿、196 亿、117 亿和 78 亿元。按 100%替换计算,则合计未来 5 年,政府、事业单位和国企采购将为国产数据库市场带来增量 626 亿(已有近乎 20%国产不替换),50%替换则新增空间 235 亿。云数据库服务得到企业青睐。云数据库作为云服务的核心组成部分,为制造业企业和小微企业提供成本低廉、功能丰富的数据存储服务,企业无需斥资购买商业数据库或者雇佣专业人员根据开源数据库自行搭建。根据国家统计局数据显示,2019 年我国小微企业超过 7000 万家,而阿里云、腾讯云、华为云用户数分别为 300 万、200 万、100 万,市场渗透率有待提高。上云已成为趋势,未来会有更多小微企业选择使用云数据库,云数据库规模将继续扩大。四、国内数据库产业基本情况与重点企业分析(详见报告原文)国内主流数据库公司以事务型为主,部分涉及分析型数据库,而云数据库通常可以使用多种数据库。当前市占率较高、具有技术领先性的商用数据库有: 武汉达梦、人大金仓 Kingbase、东软集团 OpenBASE、神舟通用 OSCAR、南大通用 GBase、科蓝软件 Goldilocks、柏睿数据库和阿里 Oceanbase、华为 GaussDB。……(报告观点属于原作者,仅供参考。报告来源:民生证券)如需报告原文档请登录【未来智库】。

德在乎天

2019,数据库行业迎50年第二次巨变

数据库与中间件和操作系统并列为全球三大基础软件技术,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等所有行业都依赖于数据库技术。由于其技术的高难度,数据库长期以来被少数公司控制了绝大部分市场份额。据不同的统计口径,全球数据库市场在300亿美金到600亿美金之间,商用数据库的领导厂商主要是Oracle、微软、IBM和SAP。自1968年IBM推出了第一代数据库DB1以及1970年IBM工程师Edgar Codd写下了最早的关系型数据模型构想的论文,随后的30年间出现了著名的数据库公司Oracle(1977年成立)、Informix(1980年成立,后被IBM收购)、Sybase(1984年成立,后被SAP收购)、Sybase与微软合作的SQL Server(后由微软接管)等,全球数据库产业在2000年前后进行了第一次大战并主要形成IBM、微软、Oracle三巨头格局。2000年以后的互联网和云计算技术变革,为数据库技术带来了“釜底抽薪”的底层计算系统变化,导致了以开源、分布式和云计算为主导的新数据库时代。2012年Google发布论文首次对外介绍了自研的具有划时代意义的Spanner全球分布式数据库、2014年AWS推出了云原生关系型数据库Aurora、2017年阿里云推出云原生关系型数据库POLARDB,2018年10月Gartner全球数据库魔力象限的领导者和挑战者象限出现了7强格局:微软、Oracle、SAP、AWS、Google、IBM和阿里云。2019年3月21日的2019阿里云峰会·北京上,阿里云发布了POLARDB的2.0版本,实现了首次兼容Oracle数据库,可帮助金融、医疗、制造等大型企业在数小时内完成业务迁移。除阿里云外,其它国内云厂商也相继推出了自研的云数据库和分布式数据库产品。2019新年伊始,数据库产业50年的第二次“世界大战”已经硝烟四起。电商巨头的技术溢出效应从Gartner的2018全球数据库魔力象限来看,AWS与阿里云是两大电商巨头的对外技术输出平台,AWS与阿里云都推出了种类丰富的数据库产品。而Google虽然是全球互联网技术和云技术的“大牛”,但Google内部技术的对外商用化输出往往晚于市场,Cloud Spanner就是直到2017年才向市场推出。过去十年,电商巨头的技术溢出效应十分明显。AWS目前已经推出的数据库产品包括Amazon DynamoDB(非关系型文档和键值数据库)、Amazon ElastiCache (提供Redis和Memcached开源分布式缓存数据库) 、Amazon Neptune(图数据库)、Amazon Elastic MapRece(EMR)Hadoop发行版,以及Amazon Relational Database Service(Amazon RDS,支持Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL、Oracle和PostgreSQL等的云数据库服务)以及云原生数据库Amazon Aurora for MySQL and PostgreSQL等。而阿里云已经推出的数据库产品包括ApsaraDB for RDS(关系型云数据库服务,支持MySQL即AliSQL、SQL Server、PostgreSQL、Redis等)、PolarDB(云原生数据库,支持MySQL、PostgreSQL、Oracle)、HybridDB for MySQL and PostgreSQL(云数据仓库)、Elastic MapRece for Hadoop、HiTSDB(时序数据库)、X-DB(分布式数据库)、GraphDB(图数据库)等,此外阿里云Apsara Stack还支持企业本地化私有云部署。无论是AWS还是阿里云,所提供的数据库及数据服务种类繁多,覆盖了绝大多数用户场景,特别是由于电商交易系统的特殊性,AWS和阿里云等开发了支持数据强一致的交易型分布式数据库,能够满足金融类业务的苛刻需求,而成本则远低于商业数据库。为什么电商企业如此孜孜不倦的钻研数据库呢?以阿里云为例。阿里最早从淘宝、天猫等电商业务发展起来,当时采用的就是IBM DB2和Oracle商用数据库,支持了早期淘宝、天猫的快速发展,这是阿里数据库发展第一个阶段。到了2011和2012的时候,双11开始上规模,业务高速发展对传统的Oracle企业级数据库解决方案提出了挑战,成本太高是首当其冲的挑战,其次当电商业务逻辑变复杂以后,需要理解Oracle数据库的技术实现,以便从根本上解决业务极限场景的挑战,但无论是请Oracle专家到现场的时间还是成本都无法满足业务要求,阿里巴巴从2012、2013年后就开始大规模使用开源数据库,这是阿里数据库发展的第二阶段。第三个发展阶段就是云时代,阿里云的业务快速发展要求自研云原生数据库,这就是POLARDB的诞生逻辑;以及在阿里集团业务中,传统用中间件进行开源数据库分为分表的解决方案也不能满足业务要求,这就是X-DB的的诞生逻辑。简单来说,电商企业的技术溢出是被业务倒逼的结果。阿里电商双十一场景,在世界范围内来看都绝无仅有,这也给了中国电商企业登顶全球基础软件技术领导地位的机会。作为全球绝无仅有的高并发挑战,阿里分布式技术经过双十一极限流量洪峰的实战考验,这也是为什么阿里云能够首次代表中国厂商冲入Gartner全球数据库魔力象限。2018年,美国犹他大学计算机系终身正教授、世界级数据库系统专家李飞飞,正式加入阿里巴巴,任数据库产品事业部负责人以及达摩院任数据库首席科学家,他于2018年底入选了2018 ACM杰出科学家。李飞飞门下弟子遍布全球所有顶尖企业的数据库部门,但李飞飞自己却选中了阿里,其主要原因就是阿里的全球独一无二的业务场景。云厂商集开源技术大成(阿里达摩院数据库首席科学家李飞飞)2019年是阿里云十周年、AWS进入第13个年头。云厂商对于开源技术的集大成,正在进入全新的阶段。2014年AWS发布Amazon Aurora的时候,当时称性能与商用数据库相当,但成本只有商用数据库的1/10。而2017年阿里云推出POLARDB的时候,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,如今性能达到AWS Aurora的2倍。不可否认,阿里云的数据库发展离不开Google和AWS等前辈的指引。谷歌最早提出了Spanner,可以实现跨数据中心的数据强一致性,这在当时是跨时代的技术,但谷歌其实是巧妙的利用了原子钟的硬件解决方案;PostgreSQL的XC/XL开源分布式数据库使用的是GTM(Global Transaction Manager)解决方案。阿里云的X-DB则采用了混合逻辑来解决分布式事务处理和查询,已经支持了几乎阿里集团所有海量数据高并发的场景。如今,阿里云正在把多个领先的数据库技术融合起来,以满足客户的更多、更高需求。云原生数据库POLARDB采用了存储计算分离、软硬件一体化设计,通过高速的RDMA网络提供共享存储的架构,可以快速实现弹性缩扩容,单个实例可扩展到1000核计算能力、同时可以横向扩展到100TB存储空间,满足大规模业务场景的需求,2.0版本则兼容Oracle。据了解,POLARDB与X-DB的优势即将融合成一体,也就是即将推出的POLARDB分布式版本。即将推出的POLARDB分布式版本是在POLARDB共享存储、一写多读的架构上结合X-DB的核心分布式技术,这样企业就可以利用X-DB的分库分表强一致分布式技术挂起多个POLARDB实例,支持几乎无限的水平规模拓展,满足企业级上百个节点高并发业务需求。POLARDB分布式版本的推出,将用一个通用商业数据库产品来满足公共云上大中小企业的需求以及线下企业级超大规模用户的需求。这款产品最大的好处之一,在于底层接入的不是单节点数据库,而是分布式共享存储且单机支持100T,这样一个200T的数据库只需要两个POLARDB实例即可,大幅降低了跨分区处理的可能性。POLARDB分布式版本这样一个集大成的通用型全场景覆盖数据库产品,当前阿里云已经储备了足够的技术和实践,现在的主要工作是产品化、标准化,以便能够快速规模化部署。李飞飞认为,阿里巴巴在分布式数据库的某些领域和某些维度上,可能超过像谷歌这样公司在分布式领域的积累,这是因为任何技术都是业务推动衍生出来的,只要有业务场景就能推动其技术从跟随发展到后发领先。除了分布式和云原生数据库技术外,李飞飞所带领的团队还专注于数据库生态工具库,也就是开发各种辅助工具帮助客户用好数据库。阿里云的一个数据库生态工具就是针对混合数据库和混合云之间的数据迁移工具ADAM,可以大幅减少不同类型数据库和云部署之间数据迁移的各种消耗和对业务的冲击;另一个工具是混合数据库管理,可以管理A/B数据库、云上和云下数据库等混部架构,满足业务对混部数据库的访问和统一控制管理需求。据了解,阿里云数据库很快将在2019年SIGMOD大会上介绍阿里云双十一场景下的分布式数据库架构。此前,谷歌Spanner、AWS Aurora等都是首先在SIDMOD会议上发布。而阿里云将登陆2019年SIGMOD会议,这也代表了中国技术厂商的成就。展望未来几年,全球数据库市场将迎来50年的第二次巨变。在2018 Gartner全球数据库魔力象限的7强格局中,AWS、阿里云和Google为开源技术厂商,微软、Oracle和IBM也大举支持开源技术。Gartner预计,开源数据库将在2019年占据20%的数据库市场份额,而到2023年75%的数据库都将登陆云平台。一场数据库的世纪之战,已经在所难免。(文/宁川)

夫子有乎

数据库产业50年变迁:传统巨头的时代已经远去

“前一个时代辉煌的巨星往往是最后一个适应变化的人。”英特尔前CEO安迪-格鲁夫曾在《只有偏执狂才能生存》一书中这样警告企业,产业变革到来,不愿意作出改变的企业将被淘汰。最典型的的例子莫过于传统胶片时代的影像巨人柯达,它最早预见到了数码影像时代的到来,但是却不愿意改变,终被淘汰。传统手机时代的巨人诺基亚,因为不愿意主动拥抱智能手机时代的到来,最终错失这个大潮,如今仅存在于人们的回忆之中。如今类似的一幕,在有着50年历史的数据库行业也在上演。数据库产业变迁上个世纪50,60年,随着美国登月工程等大型项目而生的数据库,从军用场景进入民用领域。1961年,美国通用公司研发的第一个数据库系统DBMS诞生。1976年霍尼韦尔 (Honeywell)开发了第一个商用关系数据库系统——Multics Relational Data Store。1978年,一个名为拉里·埃里森(Larry Ellison)的工程师在为美国中央情报局做一个数据项目时候,敏锐的发现关系型数据库的商机。几个月后,Oracle 1.0 诞生了,这个看起来只不过是个数据库玩具的产物,当时除了完成简单关系查询不能做任何事情,就是这样一个“玩具”,让埃里森从此踏进了信息管理这个巨大的蓝海产业,并在短短十几年间,成长为世界级的企业软件巨人。在甲骨文成立之后的30年里,传统数据库市场蓬勃发展,成为企业IT系统必不可少的核心技术,并渗透到商业的各个角落。而整个传统数据库市场经过不断地并购重组和市场竞争之后,逐渐形成了甲骨文、IBM和微软三足鼎立的局面,其中又以甲骨文的实力最为强大。因为传统数据库是封闭技术,只掌握在少数巨头手中,所以价格昂贵,这导致传统数据库的买单企业以电信、金融、能源等大型企业为主。如果产业环境没有变化,那么传统数据库市场格局可能就此稳定下来,但是互联网的兴起,给数据库市场带来了一股新生力量。2000年,互联网兴起,在当年明星互联网公司雅虎的带动之下,开源数据库软件开始兴起。MySQL、PostgreSQL等开源数据库满足了互联网企业对于海量数据、高并发处理的需求,也终结了关系型数据库只能用传统数据库软件的神话。2010年,云计算的兴起,更是为数据库市场带来了更大变化。爆炸性增长的数据量、丰富的数据类型带来了各种不同的数据处理需求,NewSQL、NoSQL以及云数据库纷纷涌现,尤其是云数据库,以AWS Aurora和阿里云POLARDB为代表,向传统数据库发起了强力冲击,数据库市场格局正在悄然发生改变。新格局产生经过近50年的沉淀,今天的数据库行业形成了三种不同的流派。第一,传统数据库。代表厂商是甲骨文、IBM、微软。顺延着大量企业级应用仍然跑在传统数据库上的势能,他们仍然在很多的大行业具有优势,比如金融、保险、能源等诸多企业级用户。第二,开源数据库。代表者是MySQL、PostgreSQL、MongoDB、MariaDB、基于Hadoop的Hbase等,开源数据库作为传统数据库的一个有效替代,很多新科技公司和互联网公司在开源的基础上,多了新的选择。第三,云原生数据库。代表产品是亚马逊的AWS Aurora,阿里云的PolarDB等。云时代已经是业界的共识,那么云原生数据库,就是匹配云时代的选择。尽管,目前采用云原生数据库的客户大多还是云原生企业,但随着数字化转型的全面开启,云原生数据库将会逐渐成为市场的主流。(红线为需购买License的商业数据库,蓝线为开源数据库及云原生数据库)根据第三方机构显示,到2021年传统数据库市场会下降20%至30%。而与此相应的则是云原生数据库的增长。权威市场研究机构Gartner预测,到2023年全球3/4的数据库都会跑在云上。此消彼长之下,江湖霸主地位的更迭似乎也就在眨眼之间。造成这一趋势的原因其实很多。首先从大环境上看,企业上云是大势所趋,而企业的核心系统大部分都是甲骨文等传统传统数据库,当这些企业逐渐核心系统上云,传统数据库的弊端也将会一览无遗。其次从云原生数据库自身来看,相比传统数据库,云原生数据库,不仅具有天然拥有云计算的弹性能力,开源数据库的简洁易用和开放生态等功能层面的优势,更为企业通过数据智能获得洞察和业务创新奠定了基础。所以,从这些方面,也不难得出结论,云原生数据库代表了最新的生产力。战略转折点已来相比传统数据库时代,今天的数据库行业因为云计算技术的广泛渗透而出现了巨大变化。这种变化不仅仅体现在数据库产品之上,这个行业的客户、竞争、经营规则等多个方面都在发生本质性的变革。某种程度上,这其实反映的是整个数据库产业正迎来战略转折点。在这个战略转折点上,亚马逊AWS、阿里云的数据库强调灵活拓展、低成本、高可用性,智能化……而传统数据库厂商却还停留在1.0时代,把自己原有技术架构的灵活性说成是云,其推出的云产品,核心技术还是围绕传统数据库——一些本来就不是云时代的技术。通常,一个产业迎来战略转折点的时候,新旧力量的竞争就会愈加明显。尤其对于那些曾经取得巨大成功的企业而言,本能的反应就是不承认这种产业变化,甚至公开抵制这种变化。就像今天的数据库市场,亚马逊AWS、阿里云、谷歌等已经在数据库市场上对甲骨文等传统数据库厂商进行包夹攻击,而甲骨文不但眼睁睁地看着他们弃用自己的产品,面对他们的进攻,更是拿不出有效的产品进行还击,坐等市场份额被蚕食。在当今这样一个快速变化的环境中,任何一项技术、产品或服务、甚至一种赢利模式,都不可能长久地维持企业的竞争优势。昨天看起来还非常有市场号召力的产业巨头,今天就很可能变得危机四伏、困难重重。海尔的张瑞敏说过,没有成功的企业,只有时代的企业,所谓成功只不过是踏准了时代的节拍。踏不准时代的节拍,辉煌的巨人也终会成为历史。数据库市场的这一幕,到底还是来了。

听之无声

大变局:中国数据库市场拐点已来

一直以来,中国数据库市场都是国际厂商唱主角,本土厂商在巨大的市场竞争压力中孱弱前行。积跬步、至千里,卧薪尝胆的本土厂商在2019年一系列精彩表现,让人们看到了中国数据库厂商取得突破的希望,市场竞争似乎开始进入一个全新的阶段,拐点悄悄到来。在这一年的市场中,中国数据库厂商不仅有入选Gartner数据的魔力象限,也有在国际性TPC-C测试中勇夺第一的佳绩,还涌现出多款重量级的数据库产品与服务,最为难得的则是在金融等重点行业的龙头客户中实现突破,首次在核心业务系统中完成了对国际品牌的替代。中国数据库市场竞争迎来新阶段然而在精彩纷呈的背后,冷静思考之余,我们也不禁要问:中国数据库市场的拐点是否真的已经到来?中国数据库产品竞争力是否真的过硬?未来是否真的可以与国际品牌形成持续的竞争?拐点真的已来?一个市场出现拐点,很重要的评判标准是有标志性事件出现。在数据库领域,市场竞争拐点的出现无疑就是在金融行业出现数据厂商与产品的重大更迭。金融行业是数据库市场中绕不开的话题。正所谓是得金融者得天下,金融行业就像是数据库市场中一块含金量最高的试金石。尤其是在金融行业的交易型数据库领域,堪称数据库领域皇冠上的明珠。值得注意的是,2019年中国数据库市场的确是发生了一件标志性的事件:中兴通讯分布式数据库GoldenDB在中信银行核心业务系统中实现了对国际数据库品牌的替代,这也是本土数据库产品首次在大型股份制银行承载核心业务系统,释放出极强的市场价值和信号。中信银行信用卡业务系统率先切换众所周知,金融行业对于数据库产品要求最为苛刻,截止到目前,国内大部分金融行业客户依然是以采用国际数据库巨头产品为主。中兴通讯GoldenDB的异军突出实属难得。但对国际数据库品牌的替代并不意味着功能和体验的降级,中国数据库产品应该带来更好的性能、功能、开发与运维体验,这样才能真正在市场上与国际数据库知名品牌掰手腕。事实上,中兴通讯GoldenDB在中信银行用实际证明了自己,展现了国产分布式数据库完全具备在金融行业大型银行全面商用的能力。根据相关数据显示,GoldenDB在中信银行信用卡中心投产后运行稳定,支撑8000万信用卡用户,日均交易金额90亿人民币。在2019年10月28日、29日,GoldenDB先后轻松通过网联1800TPS以及4500TPS的压力测试且远未达性能上限,并有效提升了客户的生产效率,其中批处理时间缩短60%,业务时延低于30ms。最终有力地支撑起中信银行信用卡核心系统通过“双十一”和“双十二”两次大战考验。“早在两年前,经中信银行测试,GoldenDB分布式数据库系统在30个分片集群、3亿用户、15亿账户规模下就已实现核心业务处理性能达到40000TPS。”某位知情人士透露道。事实上,不仅是中信银行,像招商银行、江苏银行、贵州银行、江苏农信社、广东农信社等一批银行都开始核心业务领域陆陆续续选择中国数据库品牌。这充分说明,市场拐点的的确确已经到来。支撑观点的动能是什么数据库作为三大基础软件之一,以竞争门槛高、技术含量高、产品打造难度高而著称,往往需要大量的人才、资金进行长期耐心投入。与此同时,国际数据库厂商们已经将市场门槛构筑得足够高,中国数据库厂商要想达到同样的高度或者实现超越,在产品与技术上付出更多的努力。“打造一款有竞争力的交易型数据库绝非易事,考验着产品的性能、可靠性、易用性以及可恢复性,这些都是需要日积月累才能实现的。”某位国内的数据库专家直言道。在经过四十余年的艰苦发展,中国数据库厂商主要形成了三类厂商:以人大金仓、达梦、南大通用为代表的学院派,以阿里、腾讯为代表的互联网公司派,以及以中兴、华为为代表的通信公司派。目前,三类厂商都在数据库相关产品与技术投入大量的资源。以中兴为例,其在分布式数据库领域有着将近20年的研发投入,2014年开始启动金融级交易型分布式数据库产品(GoldenDB)的研发。目前,GoldenDB已取得超过100+项核心专利,并且获得2019年Gartner OPDBMS魔力四象限推荐。本土数据库公司对数据库长期投入但光有产品与技术是不够的,更需要抓住稍纵即逝的市场契机。而这个市场契机就是当前各个行业都在加速进行的数字化转型,以及随之而来的新场景与新应用。以金融行业的银行业为例,数字化运营开始成为所有商业银行的目标,商业逻辑、业务场景、管理架构正在加速重塑,像电商、移动支付、个性化推荐、智能投顾、智能客服、互联网金融等新兴业务与应用正在对银行包括数据库在内的IT架构提出了全新挑战。某位银行CIO就透露:“小型机+传统单机数据库是支撑银行业务多年的搭配。但现在很多银行都苦不堪言,大量新业务、新场景、新应用的诞生,让这套组合有心无力。未来一定是朝着分布式架构方向发展。”当产品与技术在实际业务场景实践中不断摸索、迭代和改进,就可以形成产品、技术、场景的良性循环和迭代,进而形成强大而持续的动能。比如在银行领域,中国的银行有着世界上规模最庞大、业务场景最复杂、功能体验最为丰富的复杂业务,城商行的用户量动辄是千万级规模,大型商业银行则更是高达上亿用户群,这些都直接对数据库提出了明确和清晰的新方向:高性能、高扩展、高可用、对业务开发友好、易管理与运维、贴近金融真实业务场景的金融分布式数据库产品。从实践中来,到实践中去。像GoldenDB就是中兴与中信联合研发,基于中信各项业务场景对数据库服务需求而打造。经过5年的不断打磨,GoldenDB经历了严苛的商用考验,不仅可以提供传统单机数据库无法比拟的计算及扩展能力,还具备高可用、高可靠、资源调度灵活等特点,支持金融行业已有业务升级及创新业务快速部署的需求,已经具备全面替换银行交易类业务数据库的能力。“金融级交易型分布式数据库首先必须是安全、可靠,满足银行核心业务的关键要求。比如,实时一致的分布式事务控制,不停服务的联机重分布,丰富的监控和运维功能等等。其次,产品需要更加贴近金融行业真实业务场景,像日切卸数、多法人、联机批交易、批后会计账调整这些是金融行业特有的需求,数据库产品需要在银行业务层面更好地提供支撑。”国内另一位数据库专家介绍道。据了解,这种能够打通产品、技术、业务场景的模式目前正在包括工商银行、招商银行、中信银行等多家银行中进行。某种程度而言,中国数据库厂商现在的确迎来了发展的良机,有利于将数据库市场的竞争持续推向新的高度。未来:到底还缺什么不能否认,国外数据库厂商在整体上依然处于领先,在产品、生态、人才等方面构建完备。而中国的数据库产业现在仅仅在市场局部开始取得突破,在生态和人才建设方面依然任重道远,需要未来还有很长的一段路需要前行。中国数据库产业还有很长的路当下的中国数据库产业实际上已经看到在着手解决生态与人才的关键问题。可以看到,像阿里、腾讯、中兴、华为等公司都在加大对数据库相关业务的扶持力度、生态建设、人才培养。以中兴为例,2020年中兴正式将GoldenDB成立单独产品线进行运营,目的就是希望能够在产品、研发、市场、渠道、生态等方面更加灵活与高效,加速推动数据库业务的发展。比如在生态方面,中国数据库厂商应该具备更加开放的合作理念。尤其是信息安全可控成为大势所趋下,中国市场正在加速形成一种新的技术体系,包括国产操作系统、芯片、数据库、应用厂商们需要突破传统生态,加速数据库相关生态的建设。而在人才方面,中国数据库产业经过四十余年的发展,已经慢慢具备了一流的数据库人才体系。像阿里、腾讯、华为、中兴等公司的数据库人才绝对位于高薪之列,而且这些厂商未来多年对于数据库人才有着极高的渴求度,像中兴甚至在今年年初开启了百万年薪招聘数据库专业人才的系列招聘活动,足以看出大家对于人才的重视。正所谓是千里之行始于足下。中国数据库市场在国际厂商多年唱主角之后,迎来了一个真正的市场拐点,希望中国数据库厂商们能够能够不骄不躁、砥砺前行,打造持续的市场竞争力,真正推动中国数据库市场良性、健康发展,进而惠及到中国千行百业。

言意

数据库产业并不是传统产业

在人工智能,区块链,大数据等IT相关产业中,没有哪一家公司,哪一个项目不会使用数据库。在20世纪90年代,甲骨文成为了仅次于微软的全球第二大软件公司,当时就为很多著名的全球性公司提供数据库管理服务。(这也说明,那些往往能为更多企业服务的企业也更有影响力)时至今日,甲骨文已经在数据库管理上面积累了深厚的技术基础。然而就在去年,甲骨文在研发上就投入了90亿美元,这占去了公司10%-15%的年收入。数据库行业必须与时俱进,他就像一个仓库的管家,就像物流行业中的一个大型仓储中心。虽然MySQL已经满足企业级基本需求的,但是纵览时代潮流,高性能,高安全性,支持JSON,分布式数据库,区块链数据库仍然具有很高的成长空间。而我注意到,目前国内数据领域没有支柱性的标志性产品出现。而更加可气的是,中国的这方面的技术人才都在为国外数据库公司打工。甲骨文数据库一哥Andy率领的团队中近一半人是华人。下面是最新甲骨文数据库的几大亮点:(值得学习和超越的地方,圈起来要考)在Exadata新一代的X8M-2上通过远程直接内存访问(RDMA)访问存储上的持久化内存(PMEM),将数据库的IO速度提升到内存读写的水平,惊人的提升性能和缩短响应时间结合Infiniband或者RoCE v2硬件上基于RDMA的Exafusion协议,实现多节点Cache Fusion的性能巨大提升,进一步扩展了RAC这种基于缓存一致性的分布式处理架构的性能和应用透明性优势自动化索引(Auto Indexing),简化DBA、开发人员的负载索引调优维护工作,提升数据库性能最高60%Active Data Guard (ADG)的DML重定向功能让用户能在standby容灾库执行写操作,从而让ADG备库的应用支持更加广泛的应用场景师夷长技以制夷,华为是我们的骄傲,因为他技术研发专注和投入。而作为底层的连接前端和后台的数据库,依然具有投入的价值。

冥王星

国内数据库市场规模已达133.4亿元 增速将达15%

来源:北京日报客户端原标题:国内数据库市场增速将达15%本报讯(记者 赵鹏)数据库作为信息技术的基石,自主创新尤为重要。记者昨天获悉,2019年中国数据库市场规模达到133.4亿元,同比增长13.4%。未来3年,国内数据库产业还将保持15%左右的高速增长态势。在昨天举行的“智启未来数据创新产品发布会”上,中国电子信息产业发展研究院副院长黄子河表示,数据库和操作系统一样都是最核心的产业基础。相关产业应加速走出国门,面向全球市场开展竞争和布局。而作为国内数据库产业的主力研发机构,武汉达梦数据库已牵头制定了数据库语言搜索的相关国家标准。中国信通院云计算与大数据研究所所长何宝宏表示,随着大数据、云计算、区块链等新一代信息技术的蓬勃发展,数据库作为信息产业的基石,掌握核心技术自主,保障底层数据安全无疑十分重要。

鬼媾人

国产替代背景下,数据库和数据分析行业的发展和投资机会

图片来源@视觉中国文 | 钛资本研究院国产自主可控是最近非常热门的话题,从2018年开始启动到2019年已经有众多的厂商加入了实现国产自主可控的行列,并且随着疫情的发展、中美贸易战的摩擦,国产自主可控已经是一个核心话题。钛资本投研社邀请了投资人党成磊,分享国产替代背景下数据库与数据分析行业的发展和投资机会。党成磊毕业于上海财经大学,拥有电子信息工程学士和经济学硕士学位,曾就职于海航、复星集团、德邦证券直投子公司,有多年的产业经验,主要从事大数据、云计算、AI、安全、物联网、芯片等技术领域和技术驱动相关的金融、零售、工业互联网领域的研究和投资工作。 01 数据库市场分析操作系统、中间件、数据库是基础架构软件领域开发难度最大的三个部分,替代周期非常长,因此国产数据库会有很大替代的机会。数据库首先从OLTP和OLAP说起。如下图所示,OLTP联机事务数据库一直由Oracle、IBM DB2、MySQL、SQL Server等占据主导地位,而国内阿里的OceanBase、腾讯的TBase、达梦数据库、PingCAP才刚刚起步。2018年商业数据库市场规模147亿,Oracle在电信、金融、能源、电力领域占据主导地位,MySQL在互联网行业应用广泛,同时这个行业存在一个较大的的缺点,就是价格比较昂贵,且都基于传统的集中式架构。根据第三方统计数据,以传统集中式数据库市场为例,Oracle占比40.9%、IBM DB2占比11.9%、SQL Server占比6.7%、SAP占比5.9%,其余厂商占比分散。该市场以跨国巨头为主,国产替代安全自主可控下的国产数据库在未来将有很大的市场空间。接下来再到OLAP联机分析的数据库。OLAP从最早的数据库一体机,逐渐演变到MPP数据库和Hadoop数据库。数据库一体机价格非常昂贵,国产替代有南大通用、人大金仓、天玑、云和恩墨等;而MPP数据库的实时性非常强,现在主要是Vertica、Greenplum;最后是Hadoop数据库,有星环、中兴、华为等传统的硬件厂商在搭建Hadoop数据仓库。根据第三方数据统计,2018年OLAP的市场规模大概在70亿左右。数据库占整个IT基础架构软件的高市场份额。根据Gartner统计,2017年全球数据库管理软件的规模达到388亿美元,其中数据库软件占到整个IT基础架构软件的20%。数据库主要分两个维度:第一个维度是关系型、非关系型,例如Oracle、MySQL、DB2、SQL Server等都属于关系型数据库,MongoDB、Tigergraph、neo4j、TITAN等则属于时序数据库即非关系型数据库;第二个维度是OLTP和OLAP,就是联机事务处理和联机分析。以后的趋势是更加关注OLAP与非关系型数据库。02 数据库简史谈及数据库的发展历史,就不得不提及三位数据库领域的开拓者,分别是Frank、Micheal和Jim Gray,他们为数据库理论奠定了坚实的基础,都获得了图灵奖。早在1972年,Micheal最早提出了Ingres数据库,于2014年获得图灵奖,Ingres数据库最后分化衍生为Sybase与Postgres两部分。其中Postgres数据库有大量分析函数,适用于分析型事务,尤其是OLAP。1972年,埃里森在硅谷开发了Oracle数据库,再到1983年IBM开发了DB2数据库,同年Tdata诞生,直到1995年MySQL数据库诞生。而如今的Oracle于2009年收购了MySQL,这样一来就同时拥有了Oracle和开源的MySQL两套数据库,MySQL的创始人在离开后又开发了一套数据库MariaDB,现在国内有很多银行,像亿联银行等新的银行都在使用MariaDB。在此先回顾一下OLTP数据库的发展历程。2003-2006年,谷歌发布了几篇关于分布式关系型数据库的论文,以此为基础2012年开发了谷歌F1作为内部自用数据库;2014年CockroachDB研发分布式关系型数据库,2017年国内的刘淇团队也成功开发了PingCAP数据库;到了2015年,阿里巴巴的OcenaBase经过内部多年打磨最终对外推出使用。然后是OLAP数据库的发展历程。OLAP最早为数据库一体机,由IBM Netezza、Oracle Exadata、Teradata应用于高端存储上,对于硬件要求非常高。到2000年后MPP数据库大规模应用,成功实现了软硬件分离,数据不再需要存储在专有服务器上。2006年到2008年期间,随着Hadoop的大规模普及出现第三代分析型数据库,数据存储与HDFS之上,能够存储、计算分离、实现各节点间的访问,具有很强的扩展性能。之后在Handoop的基础上进一步完善优化数据库性能,称之为最新一代数据仓库,代表的有HAWQ、Hive、Impala等。03 数据库相关概念关于最早的数据库一体机,Oracle在收购了SUN之后开始推广软硬件一体机,开发了一款叫Oracle Exadata的产品,是由数据库服务器Database Machine和存储服务器Storage Server组成,最核心的技术是Exadata Cell,用于数据的存储和调度,现在国内的天玑云和恩墨也在做数据库一体机,是通过浪潮、曙光、联想、华为做软硬件适配。数据仓库的概念。现在有许多大中型企业都在搭建数据仓库,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于做决策管理和全局信息共享,主要功能是将OLTP联机事务处理产生的大量数据,通过数据挖掘、通过联机分析,通过OLAP来帮决策者进行统计分析。数据湖的概念。数据湖是一个存储整个企业各种各样原始数据的数据仓库,其中数据可供提取、处理、分析、传输,数据湖可以包括来自关系数据库的结构化数据,半结构化数据(CSV、日志、XML、JSON),非结构化数据(电子邮件、文档、PDF)和二进制数据(影音材料)。数据中台的概念。数据中台是将企业内外部多源异构的数据进行采集、治理、建模、分析、应用,使得数据提升内部的优化管理,数据中台是企业数字化转型的第一步。国内大量的企业由于系统建设的烟囱式导致了各个系统存在数据孤岛,后端的精英决策层无法实时的掌握前端业务的变化,因此需要一套统一的数据中台来整合数据、整合产品,形成数据共享,为敏捷型业务提供快速决策的支持,这套方法论其实最早由阿里巴巴从国外引进并应用在整个体系中,之后才得以在国内推广。下图是一个典型的数据中台的架构,按照从本地的硬件存储和云服务的存储层—>计算层->数据治理层->数据应用层->业务应用层逐层上升的模式架构而成。详细解释一下Hadoop和MPP的概念。Hadoop最早是Apache基金会开发的一个分布式的系统架构,它实现了分布式文件系统,简称HDFS,最大的特性是利用计算机集群来进行高速计算和存储,其核心是HDFS和MapRece,HDFS是海量数据的存储、MapRece是海量数据的计算。Hadoop技术的开发初衷是雅虎、谷歌等互联网公司为了做海量的互联网数据处理而设计的。2005年将之开源,很多公司例如MapR、Cloudera以及星环等都是利用Hadoop技术做商业化的应用。接下来是MPP数据库,MPP的字面意思就是大规模并行处理,主要用于实时计算场景,它和Hadoop最大的区别在于Hadoop是存储和计算都彻底分布,MPP则是计算分布、存储集中。MPP数据库分为两个流派:一个是有主节点的,以Greenplum为主;第二个流派是无主节点的,以Vertica为主。简单比较一下MPP和Hadoop:MPP是将任务并行的分散到多个服务器和节点上,每个节点各自计算,然后汇总一个结果;Hadoop应用在海量数据进行非实时的计算,它支持结构化和非结构化的数据,像互联网公司以及数据量巨大的跨国集团,都非常适用。二者相比,MPP更加强调的实时计算,它其实是中型规模的数据运算,主要支持结构化数据,尤其是像银行、证券、保险、基金等金融机构,强调数据计算实时性,普遍都会用Vertica和Greenplum。04 数据库发展趋势首先,由于 MPP和Hadoop各有优劣势,于是有创业公司尝试把MPP和Hadoop结合在一起使用。例如偶数科技利用了Hadoop的海量结构化和非结构化的特性,同时又利用了MPP实时性的优势。第二个趋势是数据库都在从集中式逐渐转到分布式。Gartner的报告中指出以下三点原因:第一点,随着数据量的增加,硬件性能的瓶颈,尤其是摩尔定律的限制,传统的集中式架构完全无法满足客户的要求,不论是数据库还是整个应用软件,都有从集中式转分布式的趋势;第二点,由于数据库设计的理论存在CAP理论,即数据库的一致性、可用性、容错性三者不可兼得,那么未来数据库一定是一个分散的市场,每家的数据库一定是各有侧重点;第三点,随着业务的发展变化,未来交易型数据库和分析型数据库会逐渐融合, AP和TP在融合,所以HTAP必定是数据库的一个未来的发展方向。第三个发展趋势是从SQL到NoSQL。Oracle、MySQL、SQL Server大部分是二位表结构,使用SQL语言,但是随着数据量的爆发式增长,像影音、文档、流媒体大幅度增加,Gartner认为数据未来一定是从SQL到NoSQL的方向发展,包括:文档数据库、健值数据库、图数据库和时序数据库。第四是关于NoSQL的发展趋势,根据DB Engines第三方的统计,图数据库是发展最快的,搜索数据库紧随其后,第三是文档数据库,第四是健值数据库。在图数据库领域有两家明星公司——硅谷的Tigergraph和Neo4j,Tigergraph上一轮估值三亿美金,由百度华创投资;还有就是文档数据库,代表性公司MongD已经是上市公司,估值92亿美金,收入2.6亿,可以看到在这个领域存在能够实现国产替代的机会。对数据库发展进行总结和回顾:首先,做数据库行业需要长时间的积累,例如Oracle从1978年开始至今已有40多年的历史,才发展成如今的规模;第二,做数据库一定要有一个生态,自从X86替换小型机,DB2的市场份额逐渐下降以及软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会;第三,做数据库需要长时间的持续性投入,要几十年如一日,例如蚂蚁金服的Oceanbase、华为的高斯、腾讯的TBASE都做了很大的投入。关于数据库行业的探讨:第一,在数据库领域,国产数据库发展还比较缓慢,在党政军领域应用较多,而在金融机构领域应用较少。国产数据库长期被Oracle、IBM、MySQL这类产品挤压,随着中美贸易战的升级、国家鼓励软件国产化,国产软件将会越来越被重视,这将是一大转变契机;第二,在国产数据库的OLTP领域,华为、阿里、腾讯等厂商有技术优势和资金优势,同时也有生态和渠道的优势;第三,创业公司进入OLTP领域门槛非常高,而在 OLAP领域,建立新一代数字据仓库以及NoSQL数据库方面,未来会涌现更多的创业公司,这块可能是很多投资机构接下来要重点关注的方向。05 数据库和数据分析领域的优秀标的数据库和数据分析行业有几家比较优秀的标的公司。第一个是偶数科技,常雷博士最早在EMC、Pivotal做MPP数据库研发,后来他在Apache基金会做了一个HAWQ开源的项目,成功结合了MPP的实时并行计算技术优势和Hadoop的可扩展性,最后将其进行商业化,成立了偶数科技。全球很多大型金融传统行业都在用其技术,偶数科技成功拿到了红杉红点的A轮融资并且已经融到了B轮。Kylingence是韩卿的创业项目,他最早是eBay中国区的员工,后来在Apache基金会做开源的Kylin项目,具有相当成熟的项目经验,该公司已经融到了C轮, 巨杉数据库2011年成立,总部在广州,王涛来自IBM DB2核心团队,主要做金融级分布式数据库,已经进入了500多家的企业,其中包括50家的大型金融机构,恒丰、广发、民生等很多金融机构都在用巨杉数据库。通过公开资料可以了解到,目前国内比较好的数据库公司包括:实时数据、流数据处理比较好的有巨杉、柏睿、人大金仓、南大通用、达梦、热璞数据库;分析型OLAP有星环、偶数、Kyligence,创邻科技;数据中台则有数澜、吉贝克、御数坊、智领云、聚云位智;数据库服务领域有云和恩墨、天玑、爱可生。大数据公司列表(公开资料整理)如下图,是对标的已经上市的大数据公司估值和融资情况,这些都是国产数据库未来的标杆:例如MongoDB是一个商业化公司主导的项目,同时做开源和商业化的版本;Mongo2007年成立,现在已经估值达到超过77亿美金,收入2.67亿;Oracle是一个长牛股,市值过千亿并且还在快速发展,国内的做基础架构软件的公司都在分析学习Oracle;最后是图分析领域,前文提到的Tigergraph和neo4j两家明星公司,现在中国银联、VISA、Mastcard很多金融机构都在用图分析做风控、做反欺诈,这个领域在未来有很大机会能够实现国产替代。对标的大数据公司估值情况(公开资料整理)Q&AQ:中国的国产数据库很多是源于开源的数据库,中国数据库能不能发展出比较大的开源生态?党成磊:首先中国有全球最大的消费市场,有PC互联网、移动互联网的人群,不论2B还是2C,我认为未来数据库一定有发展的土壤和前提条件;其次,从现状来看,像PingCap等很多创业公司,以及华为、阿里腾讯等大型公司和越来越多的金融机构都在使用数据库;三是IBM、Oracle、MySQL、SQL Server等外资大厂为中国培养了大量的数据库研发人员,再加上国家层面对国产数据库的扶持政策,相信中国数据库能发展出比较大的开源生态,生态会越来越完善。Q:现阶段这些创业公司有没有机会去挑战大厂,突破以前国产数据库厂商的天花板?党成磊:首先还是回到业务场景上来,先说金融机构,电信、电力、能源、交通、铁路这些数据密集型的行业,这几年都在干一件事——从大型机、小型机往X86迁移,在这个过程中不管是Oracle还是IBM的DB2,分布式将是一个必然趋势,例如巨杉、PingCap等公司都在做分布式关系型数据库,这是一个技术发展的必然趋势。另外随着数据量的增大,尤其是银行,原来银行业务主要是存款取款,现在银行还有理财、买基金、买电影票、交水电煤气费,信用卡分期等业务,传统Oracle集中式关系型数据库并不能很好满足的业务场景,创业公司从分析型数据库切入,是逐渐蚕食Oracle的一个方法。这次中美贸易战,自从去年Oracle把很多美国敌对国家的数据库服务停掉以后,这给国内数据库厂商很大警醒,长远来讲中国肯定还是要有自己的数据库。Q:Oracle、DB2被替换掉以后,国内自研OceanBase、高斯、TIDB和MySQL生态的竞争会如何?自研生态中大厂和创业公司的竞争会如何?党成磊:这是两个应用场景, OceanBase现在所有的客户全是金融客户,是金融关系型分布式数据库;而高斯其实是从开源上重构而成,在电信和金融行业应用得比较多;TIDB目前是在互联网行业应用较多。第二个方向其实是MySQL生态,互联网公司更倾向于使用MySQL,国内厂商做实施、集成、应用和服务。从竞争角度来讲,自研生态的技术壁垒更高,商业化和用户付费的意愿更强,所以自研生态的大厂像华为、阿里、腾讯有天然的优势。创业公司需要把产品做得足够好,还有大量的数据场景限制,大厂综合实力上比较强也有渠道销售优势,创业公司一定是自己的产品过硬,比如像PingCap或者巨杉这样解决了客户的痛点,在大厂综合实力没有那么强的时候,创业公司才能胜出。所以这个领域,我觉得确实是大厂拼综合实力,创业公司拼技术。Q:CAP理论是否可能被冲击?云数据库未来的发展,怎么看?党成磊:以阿里为例,有足够多的技术积累也有足够多的资金支持,在满足一致性和容错性的时候并没有牺牲高可用,而是用其它软硬件方案弥补。而CAP理论是整个数据库设计的基础,至少说这几年内在数据库设计原理方面还没有特别大的突破。云化会不会对传统数据库的理论、架构造成冲击,这方面多多少少是有的。首先看到现在AWS云和谷歌云上都有很多数据库,云化是一个未来,云化也会蚕食传统数据库很大一部分的市场份额,但是从技术上能不能去颠覆,还有待进一步观察和研究。钛资本研究院观察数据库的研发与应用场景密切相关。今天,中国数字经济规模已经达到32万亿,相当于GDP的1/3,涌现了大量新零售、新金融、新制造等数字业务场景,而这些场景从创新程度、创新规模和用户体量来看,都居世界前列。随着消费互联网向产业互联网的推进,消费互联网的数据库技术也在向产业和企业互联网场景演化,特别是工业互联网、车联网、物联网等大规模产业和企业互联网,都为数据库创新提供了前所未有的机遇。近期又逢《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,其中第六部分是“加快培育数据要素市场”,这标志着中央给“数据”以新的历史定位,不再视其为信息化的产物,而是上升到了生产要素的重要地位。数据要素的新定位,将为中国数据库技术发展释放政策红利,数据库与数据分析将是长期看好的创业投资领域。【钛媒体作者介绍:钛资本是专注于企业级科技的投资银行和管理咨询服务平台。微信公号:tmtcapital】

鬼网吧

互联网(IT行业)主流数据库详细汇总

什么是数据库维基百科上这样定义:以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。简单讲,数据库是一个数据仓库,用来存储结构化数据。数据库类型有哪些早期比较流行的数据库模型有三种,分别为层次式数据库、网络式数据库和关系型数据库。而在当今的互联网(IT行业)中,最常用的数据库模型主要是两种,即关系型数据库和非关系型数据库。关系型数据库:创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种关联均采用关系模型来表示。数据保存在不同的二维表里,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。传统的关系型数据库,如MySql、Oracle、db2、SqlServer、PostgreSql等采用行式存储法。非关系型数据库:非关系型数据库也被称为 NoSQL(Not Only SQL的缩写) 数据库,是对不同于传统的关系型数据库的数据库管理系统的统称,可用于超大规模数据的存储。这些类型的数据存储不需要固定的模式(当然也有固定的模式),无需多余的操作就可以横向扩展。NoSQL数据库拥有高并发、易扩展、可伸缩性,大数据下读写能力较强,而且操作简单,弱结构化存储等通用优点。NoSQL 划分为 4 种类型:键值数据库、列式数据库、文档数据库和图形数据库。键值数据库:使用一个哈希表,表中的 Key(键)用来定位 Value(值),即存储和检索具体的 Value。典型代表:Memcached、Redis(临时性键值存储),ROMA、Redis (永久性键值存储)优点:查找速度快缺点:数据无结构化列式数据库:以列簇式存储,每行列数可变,将一列数据存储在一起。典型代表:Cassandra、HBase、HP Vertica、EMC Greenplum优点:查找速度快扩展性强缺点:功能相对局限文档数据库:通过键来定位一个文档的,是键值数据库的一种衍生品。典型代表:MongoDB,CouchDB优点:数据结构要求不严格表结构可变不需要预先定义表结构缺点:查询性能不高缺乏统一的查询语法图形数据库:以图论为基础,用图来表示一个对象集合,包括顶点及连接顶点的边。典型代表:Neo4J、OrientDB、InfoGrid、Infinite Graph 、GraphDB优点:利用图结构相关算法缺点:要对整个图做计算才能得出需要的信息不太好做分布式的集群方案。关系型数据库对比分析MySql:关系型数据库,瑞典MySql公司开发,属于Oracle公司下的产品,是一个客户机/服务器结构的应用。优点:完全多线程,支持多处理器;同时访问数据库的用户数量不受限制;可以保存超过5千万条记录;运行速度快;用户权限设置简单、有效;体积小、成本低、代码开源;比较适合中小型项目开发。缺点:缺乏标准的RI(Referential Integrity-RI)机制;安全系统,复杂而非标准;没有一种存储过程(Stored Procere)语言;不支持热备份。Oracle:关系型数据库,甲骨文公司开发。在整个数据库领域一直处于领先地位,是目前世界上最流行的关系数据库管理系统。优点:开放性:能在所有主流平台上运行;安全级别高,非常高;获得最高认证级别的ISO标准认证;存储强,数据仓库存储能力非常强大;支持多种操作系统;处理速度快,非常快;保持开放平台下TPC-D和TPC-C世界记录;缺点:价格昂贵db2:关系型数据库,IBM公司研制。主要应用于大型应用系统,具有较好的可伸缩性,支持从大型机到单用户环境。优点:高层次、完整性;最适于海量数据;开放性、可移植性好;可扩展性好;自动冲突检测;DB2公认为电子商务基石。缺点:关闭机制有一定的不足;SqlServer:关系型数据库,微软公司产品。优点:操作简单;全图形界面;可伸缩性;灵活性、扩充性好;价格便宜。缺点:安全性:没有获得任何安全证书;性能 :多用户时性能不佳;PostgreSql:关系型数据库,美国加州大学计算机系研发。优点:支持继承、函数重载;复杂的sql、大量的分析函数,非常适合数据仓库;多CPU利用率比较高;缺点:对资源消耗比较大;不支持类型自动转换,需要显示转换或添加CAST;sql语法限制比较严格。非关系型数据库#仅以MongoDB为例简单介绍MongoDB:介于关系数据库和非关系数据库之间,C++语言编写,分布式文件存储,可扩展的高性能数据存储,是一种NoSQL的数据库。存放xml、json、bson类型的数据,数据结构由键值(key=>value)对组成。优点:不需要编写sql语句;不需要建表,只需定制Collection,MongoDB自动创建Collection。数据读写速度十分快;高可用和集群架构拥有十分高的扩展性;适合文档格式的存储与查询;适合做数据仓库。缺点:不支持事务操作、占用空间过大。国内有哪些比较优秀的数据库呢南大通用、武汉达梦、人大金仓、神舟通用等。ok,以上就是互联网(IT行业)主流数据库详细汇总,看完记得转发、点赞和收藏。想了解更多内容,请关注本小编,如果有错误,欢迎批评指正,感谢支持。(云渺书斋)

权舆

中国数据库杀入世界第一梯队?数据库的突破到底意味着什么?

这次席卷全球的疫情深刻地改变着我们的世界,更改变着每个人的生活,当我们习惯了云办公、视频会议、网上打卡等等工作常态的时候,对双十一从零点开始的疯狂剁手、抢购下单习以为常的时候,对物流刚刚下单尾款还没付完就收货的场景已经见怪不怪的时候,在这一切的背后到底是什么?有什么力量在支撑着我们日常生活的变化,而这一切的背后又是什么在发挥作用?直到最近一则消息打破了这一切的看似平凡:中国数据库终于打入世界第一梯队了,这到底意味着什么呢?一、杀入世界第一梯队的中国数据库根据环球网的报道,11月24日,国际知名行业研究机构 Gartner 公布 2020 年度全球数据库魔力象限评估结果,阿里云首次挺进全球数据库第一阵营——领导者(LEADERS)象限。数据库与芯片、操作系统并列为全球技术三大件,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等主要行业都依赖于数据库技术。“阿里云拥有丰富的数据库种类覆盖度和完善的产品布局,为用户提供了多种关系型和非关系型数据库产品,还提供了混合云环境部署,同时集成了备份、数据迁移与同步等能力。”Gartner分析师在报告中指出。阿里云在数据管理及数据分析领域都拥有深厚的技术积累,比如云原生分布式数据库PolarDB既解决了传统数据库容量有限、扩缩容时间长等问题,又提供了分钟级扩容、弹性变配、超高并发等能力。今年双11,PolarDB再度刷新了数据库处理峰值纪录,高达1.4亿次/秒。数据分析方面,阿里云MaxCompute和E-MapRece提供了安全、稳定、高性能的计算平台,并融合生态,提供流批一体、机器学习、数据洞察等多种分析引擎与工具。看到这里,相信很多人的感觉还是不明觉厉,但是这其中的意义到底是什么呢?二、数据库产业的突破到底意味着什么?阿里云此次的突破,让人不禁想起联想的创始人之一著名的倪光南院士的那句经典说法“目前我们国产各种芯片、操作系统、数据库等软件或硬件,整体的水平已从不可用到可用,而且正在从可用向好用的方向发展”,作为与操作系统、芯片并列的世界IT三大件之一,数据库在中国经历了太多太多,这背后也蕴含了太多的心酸和不易,而其意义我们可以归结为以下几点:第一,40年的艰苦中国追随。40年中国数据库发展历程终于挤进了世界先进行列。在这个互联网盛行的时代,数据是一切的基础,是互联网时代最宝贵的资产,而数据库则支撑起中国互联网发展的重要基础,回顾中国40多年的数据库发展,我们看到了三个阶段:一是恢复高考之后萨师煊引领的艰难探索。萨师煊作为中国数据库的奠基人在1978年就提出了数据库的理念,但是中国的数据库一直在艰难的探索中摸索前进。二是盗版盛行后甲骨文的江湖称霸。上个世纪90年代,著名数据库巨头甲骨文看到了中国市场的商机,并且发现在中国存在着大量的甲骨文盗版产品,在这样的情况下,甲骨文决定用低价抢占市场,甲骨文把数据的价格降到了只卖500美元几乎和盗版一样,结果短时间内形成了在中国的扩张,当时几乎所有企业的数据库都是甲骨文数据库+IBM小型机+EMC的模式,为了维护这套体系中国企业都必须每年支付高额的费用,市场亟待更加便捷、安全、便宜的解决方案出现。三是互联网云时代的中国突破。进入21世纪,中国互联网蓬勃发展,面对着每年的巨额数据库账单,中国的互联网企业终于开始迈出了更重要的一步,自己研发数据库并且是更先进的云数据库,通过去“IOE”的策略,让自己不要用国际巨头卡脖子交保护费,更通过自主更新数据库,逐渐有了属于自己的云数据库产品,比如说我们前文看到的阿里云的PolarDB和蚂蚁的OceanBase就是在这样的背景下产生的。经过40年的苦苦追赶,中国的数据库产业终于逐渐由市场的跟随者,市场巨头的小弟逐渐发展成为市场的竞争者,并且在第一梯队中出现了自己的身影。其次,突出国际重围的中国声音。国际市场激烈第一梯队竞争中终于有了中国的声音。好不容易在中国有了属于自己的云数据库的时候,我们纵观全球,全球的数据库江湖中,有甲骨文、IBM这样的老牌巨头,有谷歌、微软、亚马逊这样的互联网领袖,却没有中国的声音,当时的中国互联网企业默默无闻中一步一个脚印地耕耘着自己的土地,众所周知,数据库不是一个简单的业务,也不可能在短时间内通过大规模的烧钱就能够建成,这是需要长期的积累和海量的资本投入所一点一滴积淀起来的东西,就以前文的阿里云举例,阿里巴巴每年在技术研发上投入上千亿元,自研飞天云操作系统、神龙云服务器、云原生数据库PolarDB、OceanBase等,也正是这些不断的投入和开发,让我们中国自己的云数据库成为了可能。但实践是检验真理的唯一标准,是骡子是马还是要拉出来溜溜,所以在实现了从无到有之后,中国的数据库还要实现能打硬仗,能和国际巨头竞争。也正是如此,我们看到了中国数据库的逐渐开源,从原先的私有云变成了公有云,在经历了双十一的高并发洗礼,经过了全民网上办公、网上上学的考验之后,中国的数据库才敢说拥有了竞争力,而且在和国际巨头的竞争中开始展露出我们的锋芒。第三,实现自我盈利的中国道路。中国数据库终于打通了属于自己的道路,但是这也还是初级阶段,再往后数据库要逐渐具备自我的造血能力,这就是数据库盈利的挑战,世界上有众多企业投入巨资建立数据,但是还没等到数据库的服务能力能够实现自我运转,就倒在了半路之上。而中国的数据库企业们不仅开始将云端数据库用于自身,还开始用于开放,将运算能力输出出去,给互联网、金融、汽车、政府、医院等等多个领域使用,在不断对外输出的时候,自我的造血能力开始出现,亏损开始不断降低,根据阿里巴巴Q2的财报数据显示,Q2显示,阿里云经调整EBIT亏1.56亿,去年同期亏5.21亿,今年Q1亏3.42亿。而在规模经济效益下,经调整EBITA利润率从去年同期负6%提升至负1%,也正是如此逍遥子敢于宣布数据库明年就能盈利,而高盛则将阿里云估值提升至1238亿美元(人民币超8000亿元),当盈利的曙光就在眼前的时候,自我造血的道路打开这才是真正中国数据库的突围之路。三、从数据库到中国科技的全面突围其实,数据库的发展不过是中国科技发展的一个缩影而已,我们看到这些年中国的科技产业正在面临一场前所未有的大变革,而中国的互联网企业也正在承担整个产业发展的重要意义,其实,从数据库产业的发展可以看到中国当前科技突围的一些逻辑:首先,从学习到模仿再到创新已经成为了中国科技发展的必由之路,无论是数据库,还是芯片或者操作系统,其实中国都属于世界上的后发优势国家,说后发是因为中国在第一波产业科技革命到来的时候,我们并没能赶上时代的潮流,我们都是从改革开放之后开始苦苦追随,但说优势,正是由于前人给我们探索出了一条完整的道路,才让我们避免了过多的试错,可以通过学习再创新的方式形成属于自己的科技优势。其次,中国科技各个产业正在从量变到质变的关键阶段。很多人在面对激烈的市场竞争,和国际先进对手的市场压迫的时候,往往会有力不从心的感觉,比如说以芯片产业为例,台积电都已经在生产3nm芯片的时候,我们自己的工艺还在14nm之上,看上去差距巨大,但是数据库的例子告诉我们,先发优势虽然存在,但只要我们持之以恒地积累下去,实现技术突围就不是不可能事件,我们只是在量变到质变的关键阶段,咬牙坚持住就有希望的曙光。第三,科学技术正在成为中国市场长期发展的第一动能,我们总说科学技术是第一生产力,但是如今的科学技术不仅仅是第一生产力,更是市场长期发展的第一动能,我们面临着疫情之后全世界的经济下行冲击,在这样的情况下,只有牢牢抓住科学技术的动力,推动新基建的发展,才有可能进一步促进国内国外双循环的有机结合,真正驱动中国经济持续增长的关键引擎。如今,中国科技产业正在到了关键的十字路口,数据库的突围正在给我们指明一个方向,这就是坚持科技优先的战略,咬牙坚持下去,胜利的曙光就在不远的前方。