数据库自主研发【数据库自主研发资讯】

怪

陆金所数据库管理实现自主化，智能化工具立大功

如何为一台正在全马力奔跑的汽车更换发动机？陆金所难度堪比上述场景的全站“去O”（去 Oracle数据库）项目，就做到了。陆金所整个“去O”（去 Oracle数据库）项目在不停服务、不做任何服务降级的情况下，平台全站数据库“去O”已实现95%，并且通过陆金所自主研发的智能化工具，全程0故障、0风险、客户0感知。预计，陆金所将在今年6月完成全站100%“去O”。这意味着，陆金所将成为金融科技行业完全靠自主技术实现平台全面“去O”的少数几家公司之一。为什么要“去O”？降本提效、自主可控数据是现代企业经营的核心要素之一，数据技术安全与可靠性是企业命脉。数据库则是帮助企业组织、存储和管理数据的工具。所谓“去O”，简单的说就是将企业数据库从Oracle更换为开源的MySQL数据库。“去O”成为中国金融行业共识。一方面，众多企业数据库技术“受制于人”，企业数据安全性完全依赖国外供应商；另一方面，Oracle数据库授权费用高、硬件要求高、架构扩展性不足，也大大增加了企业经营成本。业内人士介绍，大型金融机构可能每年需要在Oracle软件授权费上投入上亿元，即使中小银行机构每年的投入也通常在千万元级别。除了节省高昂的软件授权费等成本，更重要的是，开源数据库MySQL可以通过修改源代码、应用自主技术定制开发，满足企业的个性化需求，架构扩展性更高。陆金所平台有着7000多种不同产品，4000多万用户，数据库从Oracle到MySQL的切换，意味着陆金所将拥有更加灵活的技术架构和安全配置，系统自主性也更强。最好的技术，是让客户全程无感无故障“不管是产品展示，还是用户查询、交易等行为，几乎都与数据库发生着深度的交互。而要将陆金所8年来累计的海量历史数据，和平台每天新增的几十亿的交易量数据，在用户无感知的情况下，进行数据库核心系统的切换，难度不亚于‘在高速公路上为正在行驶的汽车更换发动机，更换的过程还要全程对客户没有影响，不影响业务经营，也就是‘坐在车上的人没有感觉’，”王英杰介绍。经过屡次尝试，陆金所科技团队创造性提出了标准化生命周期推进方案。即把庞大的金融系统拆分成数百个小模块，通过陆金所自主研发的智能化“去O”工具，实现系统整个生命周期各个过程中的全自动化推进。秘诀在于三大核心技术，即数据动态捕获、数据动态校验以及数据库一键切换。陆金所自主研发的数据同步工具，能以表为粒度，实时把Oracle的数据同步到MySQL，并在过程中反复校验。此外，在平台流量一键切换到 MySQL的情况下，数据也能反向？与 Oracle同步，确保两个数据库的数据实时同步。“继续以更换汽车发动机举例子来说，发动机一直在运动，因此首先要获得和分析发动机各个零件的实时状态，保证能够更换掉发动机零件时依然保持在正确位置；其次是实时监测新的零件状态，确保新旧零件完全一致；最后，还要适时调配新旧零件承担的工作，以及秒级切换，做到顺畅衔接，避免更换零件导致故障。”据王英杰介绍。精心的规划与过强的技术，陆金所“去O”项目持续近两年，数据库核心系统做到了0故障，0风险、客户服务0投诉。目前，在不做任何服务降级的情况下，陆金所已将95%数据库业务由商业数据库Oracle，切换到MySQL数据库，而全站100%“去O”化将在6月底前实现。掌握核心技术，做行业“去O”排头兵实际上，如何强化自身对数据的掌控与应用，保障数据安全，已经成为金融行业重大命题。加强数据库自主核心技术，也是国家近年鼓励的发展方向。早在2014年9月，银监会、发改部门、科技部门、工信部门出台的《关于应用安全可控信息技术加强银行业网络安全和信息化建设的指导意见》就指出从2015年起，各银行业金融机构对安全可控信息技术的应用以不低于15％的比例逐年增加，直至2019年达到不低于75％的总体占比。2019年年底，央行也明确提出，要“运用最新技术发展成果探索安全可控的金融科技产品，不断提升自主研发能力和核心竞争力”。不过，虽然“去O”已成国内金融行业共识，但传统金融公司受制于有限的技术能力和过高的试错成本，现阶段只能“望O兴叹”。业内人士透露，目前国内把全部金融交易系统跑在开源数据库的金融公司，只有背靠两大互联网巨头的微众银行和蚂蚁金服。陆金所全面“去O”后，将成为市面上仅有的完全靠自主技术实现平台全面“去O”的少数几家公司之一。陆金所“去O”项目自2018 年中启动，项目涉及近千个子系统，去除的 Oracle 数据库覆盖银行理财、证券、保险、主账户、基金、信托、资管等全金融场景。短短两年时间实现95%去O,遥遥领先金融同业。陆金所表示，目前陆金所正尝试将“去O”过程中自主研发的智能化工具，打造成标准化的“去O”产品。在形成产品后，未来还将以科技输出的形式为传统金融企业赋能，加速金融行业全面“去O”进度，助力全行业降本增效。

展开

歌未央

国产数据库大有可为

本文转自【贵阳日报】；北京东方国信科技股份有限公司（简称“东方国信”）曾连续三年参加数博会，不但在现场展示旗下的技术产品线，其自主研发的分布式数据库CirroData还荣获2019数博会“新产品”领先科技成果奖。日前，东方国信分布式数据库研发中心副总经理李晓光围绕国产数据库发展现状及未来趋势、新基建等话题，接受了记者采访。东方国信一直专注大数据、云计算等核心技术领域的高科技软件技术研发，形成了CirroData数据库、工业互联网平台、云计算、5G+工业互联网融合接入与边缘计算、数据科学等五大技术产品线，依托完全自主知识产权的技术产品和解决方案，服务于通信、金融、工业、智慧城市、医疗、农业、新零售等业务板块的上千个客户。“东方国信一直致力于国产数据库的研发。”李晓光说，从2012年开始，东方国信自主研发的高性能分布式数据库CirroData，采用了先进的计算和存储分离的技术架构，融合了分布式存储和MPP并行计算的各自优势，不但轻松实现了云平台上的伸缩扩展能力，还提供了随需部署能力，作为新一代云数据仓库的典型代表，已是国产数据库的佼佼者。分布式数据库在架构、性能、可扩展、稳定性、云计算等方面都有技术突破，不仅能满足PB级海量数据的存储和分析，实现数千用户的高并发访问，同时可以满足数据密集型行业日益增大的海量数据存储、高性能加工、在线分析、即席查询和高并发访问的需求。目前，分布式数据库CirroData已取得多项专利技术，承建了北京市工程实验室创新项目，并获得工信部颁发的2017至2018年度百家大数据优秀案例奖，入围中央国家机关软件协议供货采购名录。同时，该产品还在电信、金融、能源、智慧城市、公共安全等多个领域应用落地，为近两百个客户部署5000余个节点，开始逐步替代国外的数据库产品。当前，国家大力推进新基建发展，作为IT基础设施，数据库是新基建中非常重要的一环。李晓光说，国产数据库与国外传统数据库相比，仍有一定差距，但随着政策的鼓励，国产数据库正处于技术红利期，将得到更多市场机会，通过业务场景的落地实践，大大加速产品的成熟化。从长远来看，具有完全自主知识产权的国产数据库，将迎来前所未有的发展机遇，但也将面临激烈的市场竞争。“国产数据库大有可为。”李晓光表示，新基建政策东风吹来，作为一个立足场景与应用的国产数据库产品，CirroData正以“数据库+应用”的方式快速落地，为政府与企业在数据中心建设过程中提供高质量、易扩展、低成本、易维护的解决方案，也为数据库产品的自主化、安全化、国产化做出贡献。李晓光说，工业互联网是新一轮科技革命和产业变革的产物，是供给侧结构性改革以及高质量发展的重要抓手，也是近年来国家政策引导和发展的重点。工业互联网作为新型基础设施，将进一步发挥工业操作系统的作用，促进资源配置优化和全要素生产效率提升，推进工业企业进行全面数字化转型。2019年，东方国信工业互联网发展进入快车道，自主研发的工业互联网平台Cloudiip入选国家十大跨行业跨领域工业互联网平台。“新冠肺炎疫情防控期间，Cloudiip在赋能工业企业复工复产中发挥了重大作用。”李晓光说，该平台围绕工业企业、医疗机构等及时打造系列应用，覆盖生产制造、经营管理、运维服务及疫情防控等多个大类，帮助减少疫情对经济社会造成的负面影响。贵阳日报融媒体记者刘辉

展开

分命

再次打破国外技术垄断！最强国产数据库诞生：华为、中兴、阿里上榜

【5月15日讯】相信大家都知道，中国科技产业一直都严重依赖于国外的核心技术，无论是在芯片领域，还是在操作系统领域，我国科技企业都需要大量进口，但自从经历过2018年的中兴事件、2019年的华为事件以后，国内的很多科技企业也是再次意识到了掌握核心技术的重要性，尤其是在这个互联网时代，如果无法掌握芯片、操作系统等核心技术，意味着也无法进一步保障我们国人的数据安全问题，所以在最近几年时间里，无论是在国产芯片、国产操作系统，还是在国产数据库方面，都在不断地打破国外技术垄断，不断地在掀起“国产化潮流”；尤其是在核心数据库领域，相信很多行业人士都知道，甲骨文的oracle绝对是全球最知名、最顶级的数据库系统，几乎全球最大型的数据库软件都几乎是Oracle，但随着最近几年，国产数据库快速崛起，我国的金融、电信、政企单位等都已经不再使用Oracle的数据库，纷纷开始使用国产数据库，那么在国产数据中，到底那几款产品是目前国内最强的数据库产品呢？根据相关媒体的报道，目前国产最强的三大数据库分别是华为、阿里、中兴旗下的产品，也正是由于华为、阿里、中兴这样的国产科技巨头存在，才让很多中国企业开始用上国产数据库，进一步确保我国的信息数据安全。华为高斯数据库（Gauss DB）华为最新研发的数据库产品叫做高斯数据库（Gauss DB），根据相关的统计数据显示，目前华为高斯数据库出货量已经突破了3万套，在国产数据库产品之中，名列前茅，从2007年就开始研发的华为高斯数据库，在经过了十几年的发展之后，前后也是经过了GaussDB100、GaussDB200、GaussDB30三代产品迭代后，如今华为高斯数据库已经正式得到了招商银行、工商银行的验证以及认可，同时国内的三大运营商都有在使用华为高斯数据库产品，目前华为高斯数据库产品无疑也是已经得到了认可；阿里分布式关系数据库OceanBase阿里巴巴自主研发的分布式关系数据库OceanBase，根据TPC-C所公布的评测成绩来看，阿里巴巴的分布式关系数据库OceanBase所取得成绩，更是Oracle（甲骨文）的成绩两倍之多，位居全球榜首，这不仅仅是中国数据库首次进入到TPC-C测试前十名，同时也更是获得了全球第一的好成绩。中兴GoldenDB数据库根据相关媒体的报道，中兴的GoldenDB数据库已经开始为银行提供核心的业务数据库，并且中兴这款数据库产品更是直接在“分布式数据库能力测评”中，获得满分的成绩，可见中兴这款数据库产品的实力到底有多强悍。而目前中兴的GoldenDB数据库已经开始被应用于金融领域，开始为各大银行提供核心业务数据库产品；写在最后：随着国产数据库产品不断崛起，尤其是在华为、阿里、中兴等众多国产科技巨头的助力之下，也是不断地在打破国外技术的垄断，不知道各位小伙伴们，你们对于正在崛起的国产数据库，都有什么样的意见和看法呢？欢迎在评论区中留言讨论，期待你们的精彩评论！

展开

大三元

达梦四十年磨一剑撑起数据库自主旗帜

11月25日，达梦召开2020创新产品发布会。会上，达梦发布了达梦数据共享集群、达梦启云数据库、达梦新一代分布式数据库、梦图数据库四款新产品，与合作伙伴回溯了艰辛的发展历程，分享了合作中的酸甜苦辣。当下，国内很多公司引进国外源码包装成国产，或基于开源数据库进行二次开发，其中甚至不乏市值破千亿的明星公司。相比于引进开源或国外源码这种短平快的发展模式，达梦则始终坚持自主原创，四十年磨一剑。在数据库领域，撑起了数据库自主创新旗帜。达梦四十年磨一剑终成国产化数据库领导者上世纪70年代末，武钢热轧车间花费巨资从日本引进了一套无人值守管理系统。为了防止技术泄密，日本人在调试安装完设备后，把足足三卡车的技术资料当场销毁。在现场目睹了这一幕的冯裕才痛下决心，一定要研发出中国人自己的数据库系统。当时，甲骨文、微软、IBM等数据库产品尚未进入我国，在没有国外产品可以参考的情况下，冯裕才潜心研究，用了8年时间终于开发出第一套数据库管理系统CRDS，在之后的几年里多次在科技部国产数据库招标中名列第一，并承接了一批图形数据库、标准数据库、地图数据库项目。2000年，达梦公司正式成立，开始迈出商业化的第一步。商业市场既波澜壮阔，也充满暗礁漩涡。由于习惯于在象牙塔中搞研发，对于资本运作不甚了解，加上同时期甲骨文、微软、IBM等外商的产品在国内横行无阻，达梦的商业化之路非常曲折，公司差点倒闭，冯裕才一度想转型系统集成商，不卖数据库产品，而是搭成一套应用系统卖。最艰难的时候冯裕才自己掏钱给员工发工资。很多时候，达梦往往成为竞标中的陪跑者，成为招标单位用来和外商杀价的工具。当达梦逐渐适应市场后，国内一些公司引进国外开源技术，或是买IBM公司的源代码，在一些技术指标上把达梦挤下去。其实，自达梦公司成立以来，有从美国留学回来的学生想把美国公司的源代码直接卖给达梦，也有美国公司想收购冯裕才的技术团队，还有人呼吁达梦放弃自主研发，也采用免费的开源技术。面对拿来主义、外资收购、开源技术等诱惑，达梦咬定青山不放松，始终坚持自主研发，自己掌握核心技术。目前，上海浦东新区数据中心、武汉市政府投资项目监管平台、广州市信息化服务中心数据中心、重庆市政法系统信息共享平台、、中铁建财务共享平台、吉林财政国库集中支付、建设银行业务收发文应用平台、人民银行湖北分行金融基础信息查询系统、武汉住房公积金核心业务系统、国家智能电网调度指挥系统D5000、南方电网OS2地级主站系统、泰国教育云平台等项目均采用达梦数据库，历经40年的磨炼，达梦成为最纯粹的国产化数据库的领导者。十二年如一日填补技术空白数据共享集群是在多台服务器上构建高可用性数据库系统的最佳解决方案，也是数据库领域技术的制高点，是商业数据库技术的皇冠，这项关键的核心技术在我们的金融、电力、运营商等核心重点的行业市场占有率超过了60%。在最近几年“开源运动”和分布式数据库、NoSQL数据库如火如荼的大背景下，共享集群在重点行业的地位依然无可替代，因为无论技术的风口怎么在变，共享集群的价值无可替代，并仍然被用户广泛的认可。达梦数据共享集群的关键技术也不是一蹴而就的。2008年，国家电网提出数据共享存储集群的相关需求。2012年，达梦实现两个节点，两台服务器共享集群的关键技术。不过，这对于达梦而言，只是完成了0到1的突破。拿到了入场门票后，还有更多的工作要做，因为用户需要的是一款成熟的产品，后面还有99%的工作需要我们继续去努力。在过去几年里，达梦数据库在共享集群的几个方面做了持续改进：一是规模。诚然，国外的共享集群在实际应用当中绝大多数都是两个节点打以天下，四个节点用的都不是特别多，但一款商品要想在市场上被广泛接受，就必须有应对所有场景的能力。目前，达梦数据共享集群做到了从两个节点到八个节点规模的支持，并且通过了第三方机构的测试，后续还会继续向16个节点的规模去做演进。二是服务中断的时间问题。对于关键核心的业务用户非常关注，如果以5个9的指标来考量，每年发生一次故障，数据库可以用于故障处理的时间是5分钟，如果故障发生频率提高每个月一次，留给数据库的时间就是25秒。也就是换句话说，以5个9为目标，共享存储集群如果能够做到每次故障切换时间控制在25秒以内，就能够承受每月发生一次系统故障。为了达到这个目标，达梦通过理论分析，确定了共享存储集群架构在故障切换时间方面的理论性优势，通过持续优化，将故障切换时间从以前的冷备方案的小时级，改进优化到共享集群的10秒到30秒的速度，基本上完成了5个9的技术要求三是数据容灾。达梦可以向用户提供从50公里级到1000公里级，以及两地三中心的容灾解决组合方案。在本地或者是在同城基于达梦数据守护技术和达梦数据共享集群进行组合，可以实现RPO为0的超级容灾。在1000公里级的容灾，基于达梦的实时同步技术，可以实现延时为秒级的数据容灾。上面两项技术的组合，还可以构建两地三中心的容灾解决方案。四是性能。达梦单机四节点的共享集群TPC—C值超过了200万，八节点超过了300万，具有不错的横向扩展能力。可以说，在TPC—C90%操作都是写操作的业务产品，对于集中式架构而言是一个突破。五是存储管理。达梦进一步改进了存储管理系统，引入了在裸设备之外引入了快设备方式的存储管理，并且提供了存储条带化功能。这两项特性的引入能够更好的提供运维便利性和性能表现。六是平台支持。实现了对各种主流CPU的全面支持。由于过去只有少数美国公司掌握这项关键技术，数据共享集群此前从来没有在国产CPU上面跑起来，达梦实现了网信名录内所有国产CPU均支持。南京某首个基于国产CPU+共享存储集群的上线业务系统就是采用了达梦的数据库。在浙江电网共享存储集群支撑了电网的核心业务系统，事关到5000万人的正常生产和生活的工作，这个系统也是基于达梦数据库。这里有一个测试的数据，在一个写入操作达到了50%比例的仿真测试场景当中，在四节点规模的集群下面实现了90%操作的响应时间，不超过1秒，并且吞吐量达到了每秒3000笔业务的成绩。过去，在全世界只有甲骨文、IBM等个别美国公司掌握这项技术，而且没有开源的技术可以参考，这从侧面可以印证这项技术的基础难度。达梦经过12年的积累，终于掌握了这项关键技术，实现与国外的数据库产品同台竞技。相对于那些只会引进国外源码或拿开源代码做修改的公司而言，达梦12年如一日填补国内空白，是尤为可贵的。

展开

隔离墩

十年磨一剑，中国打造国产数据库

以5G、物联网、人工智能为代表的第四次科技革命浪潮正在席卷全球，大数据作为新一轮科技革命和产业变革交叉融合的引爆点，成为各国竞逐的赛道。上周，甲骨文宣布关闭中国研发中心的消息震动中国软件圈，本周美国又针对华为发布禁令，接二连三的打压让中国人越来越意识到，随着大数据、物联网等数字化的基础设施和能力的迅速构建，要想要不受制于人，发展我国安全自主可控的核心技术的需求变得尤其迫切，不管是在硬件还是软件领域。数据处理能力是核心竞争力早在十几年前，中国就已经开始构建国产数据库等自主产权和生态圈，历时十年，通过中国技术优势的不断提升和政府的大力支持，已经取得了长足的进步。然而，要打造真正强大的以数据处理为核心的产业链，十年时间还远远不够。日前在上海嘉定举行的一场关注数据处理技术和产业的峰会上，来自工信部的技术专家，以及南大通用、柏睿数据等全国顶尖的数据库公司的高层和骨干精英就目前的形势发表看法。他们一致认为，数据时代，数据处理能力是核心竞争力，因此一定要坚持自主研究开发底层技术的策略。中国工程院院士邬江兴表示：“大数据的发展催生了很多浅层数据资源的开发，但是从浅层到深层的数据资源挖掘，需要开发新的技术和装备，这仰赖于软硬件的协同计算，数据流的计算能力非常重要。未来是计算、存储、传输一体化的超级网络计算。”在工信部信息化和软件服务业司软件产业处调研员傅永宝看来，数据已经成为政府和企业的重要资产，精准地处理大规模数据、挖掘数据价值是促进我国数字化经济快速发展的基础保障。我国已经诞生了阿里、腾讯等一大批科技巨头自主研发的数据库，在数据处理和融合应用方面取得一定成果，但在核心技术和产业规模方面仍然面临挑战。对此，傅永宝提出：“首先，核心技术研发仍然有待突破；第二，数据处理与其他新技术的融合发展仍然有待深入；第三，产业生态建设仍然不完善；最后，数据处理产业机构和区域分布仍然不均衡。”为此，我国发布的《大数据产业发展规划（2016－2020年）》明确提出了要重视大数据技术与产品的研发、创新应用、培育主体企业、制定标准体系、完善产业体系、提升大数据安全保障能力。柏睿数据董事长刘睿民对第一财经记者表示：“技术标准化是一项非常复杂的工作，要求有理论支撑与实际应用。我国大数据产业的发展优势在应用层，并且诞生了很多世界级的大数据应用项目。但在理论与基础层仍落后于欧美等国家。柏睿数据一直在推动中国技术的国际标准化，以前沿引领技术与颠覆性技术创新为突破口，才能积极抢占科技竞争和未来发展制高点。”刘睿民表示，在坚持自主研发技术，占领业内制高点方面，华为是行业的标杆。“这也给我们带来使命感，只有努力实现关键核心技术自主可控，才能把创新主动权、发展主动权牢牢掌握在自己手中，促进中国产业迈向全球价值链中高端。”刘睿民告诉第一财经记者。数据库作为新一轮技术革命的基础物料，是支撑人工智能、云计算、区块链等新技术的根本，各种利用数据分析而来的应用场景，都是通过庞大数据资源进行计算的结果。上周，甲骨文意外宣布关闭中国研发中心，之所以引起各方的高度关注，刘睿民认为，这是因为数据库是一切应用的基础。他表示：“芯片CPU、操作系统、数据库三者整合构成了基于数据的数字经济的最核心部件，其他的应用都要建立在这三者之上，技术门槛较高。”制定国际标准打破巨头垄断1996年从吉林大学毕业以来，刘睿民一直从事数据库的调优以及数据库底层的实现，先后在惠普、太阳微系统、甲骨文、联想等企业工作，2014他创立的柏睿数据专注于全内存分布式数据库。在刘睿民看来，我国在数据库领域缺少技术与竞争，而且相比较与竞争较为激烈的软件应用而言，数据库技术更能够应对当前的这种高容量、高并发、实时动态的数字经济变化的环境，同时这也是国家倡导的自主可控的产业的关键环节。基于自主可控的国产技术，在工信部指导下，柏睿数据针对国际技术垄断巨头甲骨文、SAP进行国产高端内存数据库产品替代。刘睿民表示：“从中美贸易问题可以发现，美国的根本目的是抑制中国的产业升级与科技发展，而英特尔、Facebook等被曝出的技术和安全漏洞，无疑也是对我国信息安全的警醒。解决这些问题的出路就要发展具有国际标准的自主可控的核心技术，将科技掌握在自己的手中。”去年，刘睿民作为主笔人参与了中国主导制定的2018年流数据库国际标准的制定。这是我国30年来首个提案通过的数据库领域国际标准，打破了欧美国家对数据库技术的垄断，也为我国今后大数据、区块链、人工智能等领域的发展提供了标准技术保障。同样是在甲骨文公司工作超过十年的数据库专家武新博士，自2008年投身中国自主核心技术的研发，加盟了我国数据库的领军企业南大通用，担任首席技术官，一干就是十年。武新博士对第一财经记者表示：“我认为中国经济发展到目前的阶段，是时候发展自主可控的核心技术了，中国需要有自己的基础软件。我们希望中国早日摆脱对国外大型软件公司的依赖，在全球技术竞争的过程中更有底气。”武新博士说道，数据库产品的国产化事关国家安全，他告诉第一财经记者，尽管中国本土的数据库公司努力了十几年，但是掌控着中国数以亿计的个人用户资料的大银行和电信行业，目前仍然都是采用外国数据库产品，而一旦这些数据外泄，可能对中国人的个人隐私有极大的伤害。武新博士加入南大通用后，主导了南大通用与包括中国农业银行在内的金融机构的合作，为其建立国产数据库。农业银行拥有9亿多客户和海量数据信息，目前已经使用了南大通用大数据平台的技术，下一步双方还将在实验室把人工智能的成果与金融科技相结合。但武新也认识到中国数据库与发达国家的差距。他对第一财经记者表示：“最大的差距是生态系统。甲骨文、微软这些公司经过几十年的发展，建立起非常强大的生态系统，这种依存关系还将维持一二十年，而中国的生态系统仍然较为薄弱，这与我们缺乏技术基础积累有关。”

展开

瑛太

国产数据库大有可为——访北京东方国信科技股份有限公司分布式数据库研发中心副总经理李晓光

北京东方国信科技股份有限公司（简称“东方国信”）曾连续三年参加数博会，不但在现场展示旗下的技术产品线，其自主研发的分布式数据库CirroData还荣获2019数博会“新产品”领先科技成果奖。日前，东方国信分布式数据库研发中心副总经理李晓光围绕国产数据库发展现状及未来趋势、新基建等话题，接受了记者采访。东方国信一直专注大数据、云计算等核心技术领域的高科技软件技术研发，形成了CirroData数据库、工业互联网平台、云计算、5G+工业互联网融合接入与边缘计算、数据科学等五大技术产品线，依托完全自主知识产权的技术产品和解决方案，服务于通信、金融、工业、智慧城市、医疗、农业、新零售等业务板块的上千个客户。“东方国信一直致力于国产数据库的研发。”李晓光说，从2012年开始，东方国信自主研发的高性能分布式数据库CirroData，采用了先进的计算和存储分离的技术架构，融合了分布式存储和MPP并行计算的各自优势，不但轻松实现了云平台上的伸缩扩展能力，还提供了随需部署能力，作为新一代云数据仓库的典型代表，已是国产数据库的佼佼者。分布式数据库在架构、性能、可扩展、稳定性、云计算等方面都有技术突破，不仅能满足PB级海量数据的存储和分析，实现数千用户的高并发访问，同时可以满足数据密集型行业日益增大的海量数据存储、高性能加工、在线分析、即席查询和高并发访问的需求。目前，分布式数据库CirroData已取得多项专利技术，承建了北京市工程实验室创新项目，并获得工信部颁发的2017至2018年度百家大数据优秀案例奖，入围中央国家机关软件协议供货采购名录。同时，该产品还在电信、金融、能源、智慧城市、公共安全等多个领域应用落地，为近两百个客户部署5000余个节点，开始逐步替代国外的数据库产品。当前，国家大力推进新基建发展，作为IT基础设施，数据库是新基建中非常重要的一环。李晓光说，国产数据库与国外传统数据库相比，仍有一定差距，但随着政策的鼓励，国产数据库正处于技术红利期，将得到更多市场机会，通过业务场景的落地实践，大大加速产品的成熟化。从长远来看，具有完全自主知识产权的国产数据库，将迎来前所未有的发展机遇，但也将面临激烈的市场竞争。“国产数据库大有可为。”李晓光表示，新基建政策东风吹来，作为一个立足场景与应用的国产数据库产品，CirroData正以“数据库+应用”的方式快速落地，为政府与企业在数据中心建设过程中提供高质量、易扩展、低成本、易维护的解决方案，也为数据库产品的自主化、安全化、国产化做出贡献。李晓光说，工业互联网是新一轮科技革命和产业变革的产物，是供给侧结构性改革以及高质量发展的重要抓手，也是近年来国家政策引导和发展的重点。工业互联网作为新型基础设施，将进一步发挥工业操作系统的作用，促进资源配置优化和全要素生产效率提升，推进工业企业进行全面数字化转型。2019年，东方国信工业互联网发展进入快车道，自主研发的工业互联网平台Cloudiip入选国家十大跨行业跨领域工业互联网平台。“新冠肺炎疫情防控期间，Cloudiip在赋能工业企业复工复产中发挥了重大作用。”李晓光说，该平台围绕工业企业、医疗机构等及时打造系列应用，覆盖生产制造、经营管理、运维服务及疫情防控等多个大类，帮助减少疫情对经济社会造成的负面影响。来源：贵阳日报编辑罗昌编审王太师王莉

展开

九天

发展国产数据库大有可为

连续三年参加贵阳数博会的北京东方国信科技股份有限公司（简称：东方国信），自主研发的分布式数据库 CirroData，荣获 2019 年贵阳数博会 " 新产品 " 领先科技成果奖。在 " 永不落幕的数博会 "2020 系列活动——数博访问中，主要负责人参与直播访谈，超过 1.9 万网友观看。日前，该公司分布式数据库研发中心副总经理李晓光围绕国产数据库发展现状及未来趋势、数据新基建等话题，接受了记者采访。东方国信上市 23 年来，一直专注大数据、云计算等核心技术领域的高科技软件技术研发，形成了 CirroData 数据库、工业互联网平台、云计算、5G+ 工业互联网融合接入与边缘计算、数据科学等五大技术产品线，服务于通信、金融、智慧城市等业务板块的上千家客户。" 东方国信一直致力于国产数据库的研发。" 李晓光介绍， 2012 年开始，自主研发的高性能分布式数据库 CirroData，采用了先进的计算和存储分离的技术架构，融合了分布式存储和 MPP 并行计算的各自优势，是国产数据库的佼佼者。当前，国家大力推进发展 " 新基建 "，数据库作为 IT 基础设施是 " 新基建 " 中重要的一环。李晓光说，国产数据库与国外传统数据库相比仍有差距，但国产数据库正处于技术红利期，将得到更多的市场机会。从长远来看，具有完全自主知识产权的国产数据库，将迎来前所未有的机遇，但也面临激烈竞争。李晓光说，工业互联网是新一轮科技革命和产业变革的产物，是供给侧结构性改革以及高质量发展的重要抓手，是近年来国家政策引导和发展的重点。数据基建时代，工业互联网作为新型基础设施，将进一步发挥工业操作系统的作用，促进资源配置优化和全要素生产效率提升，推进工业企业的全面数字化转型。2019 年，东方国信自主研发的工业互联网平台 Cloudiip 入选国家十大跨行业跨领域工业互联网平台。工业和信息化部与中央广播电视总台联合出品的首部大数据纪录片《大数据时代》，东方国信运用炼铁大数据实现高炉数字化改造，作为传统工业转型升级案例，真实记录了工业互联网为钢铁行业带来的革命性变革。" 疫情期间，工业互联网平台 Cloudiip 在赋能工业企业复工复产中，发挥了重大作用。" 李晓光介绍说，平台围绕工业企业、医疗机构等及时打造系列应用，覆盖生产制造、疫情防控等多个大类，全面助力企业实现高效、便捷、在线、协同的工作模式，最大限度降低疫情对经济社会的负面影响。【来源：ZAKER贵阳】声明：转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本网联系，我们将及时更正、删除，谢谢。邮箱地址：newmedia@xxcb.cn

展开

地其外乎

创意信息：目前公司以数据库产品为主的自主可控产品研发在继续投入中

同花顺金融研究中心6月10日讯，有投资者向创意信息提问，懂秘您好，公司的操作系统、数据库、5g微基站业务开展怎样？公司回答表示，目前公司以数据库产品为主的自主可控产品研发在继续投入中，业务上积极寻求“信创”产业机会并积极拓展重点行业客户。公司5G相关产品及业务包括：5G小基站核心技术和产品研发、5G垂直行业应用解决方案、5G微站电源及5G微站智能监控产品。5G微站电源及5G微站智能监控产品已正式投入市场并产生订单，但目前收入体量较小，不会对公司财务报表产生重大影响，5G小基站正在按计划研发过程中，5G行业解决方案也在落地过程中。感谢您的关注。来源: 同花顺金融研究中心

展开

好声音

南大专家团队自主研发人工智能算法，用大数据揭秘3亿年生命演化

科技部高技术研究发展中心日前发布“2020年度中国科学十大进展”，其中一项进展是，南京大学沈树忠、樊隽轩团队联合国内外专家创建国际大型数据库，自主研发人工智能算法，利用“天河二号”超算取得突破，获得了全球第一条高精度的古生代3亿多年的海洋生物多样性演化曲线，时间分辨率较国际同类研究提高400多倍。生命起源与演化是自然科学领域的十大科学问题之一。地球生命从最早的单细胞生命，到纷繁复杂、高度多样化的现今生命世界，中间经历了复杂的甚至可以称之为波澜壮阔的演化过程。本报约请樊隽轩教授撰文向读者解读该项研究的科学内容。寒武纪莱得利基虫化石。奥陶纪镜眼虫化石。志留纪王冠虫化石。泥盆纪鸮头贝化石。石炭纪栉羊齿化石。二叠纪扇贝化石。早先化石古生物数据库识别出五大灭绝事件2011年国际著名学术期刊《自然》报道，根据科学家的估算，现今地球上一共有870万种生物物种。地球已经有46亿年的历史，其中最早的地球生命出现在38亿年前。在这漫长的生命历史中，不断有物种消失，以及新的生命类型的出现。那么，在整个地球历史中，一共存在过多少物种呢？根据科学家的估算，这个数字是40亿！也就是说，如果要恢复生命演化的全部历史，我们就必须对所有现生的以及已经消失的物种进行全面的统计。对于这些已经消失的物种，只能通过它们留下来的化石记录来进行统计分析。比如三叶虫最后的化石记录发现于二叠纪末的沉积岩里，因此科学家就可以推测，三叶虫最终消失的时间是在2.5亿年前。对化石记录开展的研究已有数百年历史，地质学家和古生物学家已经积累了海量的化石记录信息。对这样庞大的数据进行准确、可靠的分析，就必须利用大数据的手段。上世纪70到80年代，美国芝加哥大学的演化古生物学家杰克·塞普柯普斯基教授，耗费十多年时间，收集了北美、欧洲等地的化石记录，构建了第一个较为完整的古生物数据库。这个数据库里，只有化石的分类名称，以及该种化石出现的时间以及消失的时间，虽然信息很简单，但是已经可以用来统计各个时段有多少种化石生物了。地球历史很长，以亿年计。塞普柯普斯基的这项研究，时间精度或者说时间单位只能做到以千万年计，也就是说只能统计到每一千万年地球上生活过多少种生物。通过这个方法，他识别出过去6亿年的地球生物多样性的变化规律。这就相当于人类五千年历史中，统计出了每一百年的人口变化。在这个生物多样性变化曲线上，他识别出了五次显著的生物类群数目快速下降的事件，他称之为五大灭绝事件，代表了地球历史上最为重要的五次生命灾难。这项研究被誉为20世纪后半叶地球科学领域最为重要的发现之一。后来的学者觉得这个数据库太简单，有必要建立一个更为庞大的数据库，收录种类更丰富的信息，不仅可以重新检验上述结果，还可以进一步揭示生命演化的机理、机制及其与地球环境变迁间的关系等。1998年，在美国国家自然科学基金委的支持下，一批美国与欧洲的古生物学家联合，发起了一个大型的古生物网络数据库项目。这个数据库的结构要复杂得多，不仅包含了上述化石的名称以及出现和消失的时间信息，还包括了产出化石的岩石信息、化石生物的地理位置信息、化石生物的生活状态信息等。利用这些数据，这些科学家在2008年重新计算了过去6亿年的地球生物多样性曲线，时间精度与上述曲线类似，也是一千万年。这一新曲线与塞普柯普斯基的曲线相比，既有相似的地方，但也存在一些不同的地方。这两条曲线，究竟哪条曲线更准确呢？如果我们重新回顾一下这两项研究，可以发现他们统计生物数目的时候时间单位是以千万年计，这个精度是很粗糙的，因此容易带入一些因为时间不准确导致的偏差。数据、算法和算力创新推动古生物时间分辨率大大提高为了获得更加全面、可靠的古生物多样性曲线，需要实现三方面的突破，一是需要更加准确的海量化石记录，也就是古生物大数据的支撑；二是需要研发全新的算法，实现数据的有效计算与分析；三是需要强大的算力，从而可以在有限的时间里，比如数周内完成计算与分析。南京大学沈树忠、樊隽轩团队联合国内外专家开发了一个全新的国际大数据平台，可以实现全球古生物资料的高效数字化、集成、管理与应用。并组建了一个国际一流的数字化队伍，耗费数年时间将中国85%以上的化石记录都收集起来，并开放给全球的同行使用。在算法方面，传统的定量统计方法不再适用。科学家团队尝试与信息科学相结合，研发全新的算法。在古生物学领域有一个重要的基本概念，即化石的保存和采样概率。前者指古代生物有多大的概率变成化石，后者指化石有多大的概率被我们发掘出来。比如，某片森林里曾经生活过几只松鼠，当它们死后，未必都能被埋到土里成为化石。因为有可能被狐狸叼走了，也可能被细菌分解破坏了。就算埋到土里成为化石，也未必能被古生物学家所发现，因为古生物学家不可能把整个森林都挖开去找寻每一个化石。正因为化石存在保存和采样概率，所以在各个化石挖掘点找到的化石出现和消失的时间就有可能存在问题，这就导致化石的出现或消失的先后顺序可能会颠倒。举个例子，比如李白出生在公元701年，杜甫出生在公元712年，李白的出生比杜甫早了11年，但是，假设史书中的记录有偏差，缺了李白的一些编年史记录，导致关于李白的最早记录是公元713年，那么后人在整理资料时就会以为杜甫的出生比李白早一年。如果将每个化石挖掘点找到的化石记录看作是一本化石编年史，每本编年史都是不完整的，有的记录了李白出生更早，有的则是杜甫更早。假设李白应该比杜甫更早，然后看看有多少本书里的记录与之不符，每一次不符记为1，其总和就代表了“李白早于杜甫”这一假设与实际记录的不吻合程度。假设有100种化石，对每两种化石的先后顺序都进行这样的假设和比较，最后就可以得到这100种化石的一个假设的顺序以及对应的总不吻合度。求取不吻合度最小的那个顺序，这就是化石在全球出现的最合理的顺序，在这个基础上，就可以计算出高分辨率的生物多样性曲线。通过这种方法，将可以获得时间精度是2万至3万年的多样性曲线。如果将过去6亿年的生命历史对应到人类文明的五千年，这一分辨率就相当于我们每两三个月就统计一次全球的人口总数，看看变化趋势是什么。生命演化的时间精度达到万年尺度，这代表的就是生命演化领域目前的世界纪录了。获得这样的时间分辨率，需要非常庞大的算力的支撑。根据科学家的估算，如果对1万种化石的地质记录计算和分析一次，当前主流的台式机需要17年！所以，研究团队拜访了中国的多个超级计算机。其中，位于广东中山大学的“天河二号”超级计算机在2013年到2016年都是世界上最快的超级计算机。科学家最终采用了“天河二号”，同时使用1万多个CPU核心进行计算，原本需要17年才能完成的一次计算，最终只用了两三天。更精细的生物多样性曲线揭示3亿年生命演化史在大数据、算法和算力方面都取得了突破之后，科学家团队正式开始了计算，并最终获得了从5.4亿年前开始到2.4亿年前的3亿年地球生物多样性变化的曲线。与国际的同类研究相比，这一新曲线的时间分辨率提高了400倍，彻底改变了对该时期海洋生物演化的一些传统认识。该项研究表明，前人使用的低分辨率且不均一的时间标尺，会直接影响对古生物多样性的估算，导致无法准确评估生物多样性的变化速率和模式，并可能掩盖突发性的重大事件以及短时间的剧烈波动。比如有的时候生物正面临多样性危机，或者是生命形式正快速爆发、增长的时候，前人的曲线会显示完全不同的规律。新的多样性变化曲线更加准确地重现了地质历史中最大的三次生物灭绝事件和三次重大生物辐射事件的精细过程。三次生物大灭绝事件，其中2.52亿年前发生了人类迄今为止识别出的最大规模的生物灭绝事件，导致超过70%的海洋生物在数万年内迅速灭亡，这一事件的发生，与当时全球气候的快速升温密切相关。——奥陶纪末生物大灭绝：五大灭绝事件之一；发生在奥陶纪、志留纪之交（4.47亿至4.45亿年前），导致34%的海洋生物快速消失。——中-晚泥盆世生物大灭绝：五大灭绝事件之一；始于3.93亿年前，并一直延续至3.68亿年前，持续两千五百万年，导致59%的海洋生物消失。——二叠纪末生物大灭绝：五大灭绝事件之首；发生在二叠纪、三叠纪之交（2.52亿年前），生物多样性在数万年里急剧下降超过70%。三次重要的生物辐射事件，多与当时全球气候的逐渐变冷同步。深刻理解这些重大生物事件的驱动机制，对于我们认识当今地球生物多样性以及与全球气候变化之间的关系具有重要启示意义。——奥陶纪生物大辐射事件：发生在4.97亿至4.67亿年前，物种多样性快速增长，并增加了近三倍。——志留纪初生物辐射事件：发生在4.45亿至4.37亿年前，奥陶纪末生物大灭绝结束后，生物快速复苏并辐射，多样性增加约80%。——石炭纪-二叠纪生物辐射事件：发生在3.35亿至2.95亿年前，多样性增加三倍，基本与奥陶纪大辐射事件相当。地质历史中生物多样性的重大变化，通常也伴随着环境的剧烈波动。前人研究表明，生物多样性变化可能与多项环境因子的变化同步，如古气候、海平面、总栖息地面积和大陆连通性等。各重要生物事件与环境变化之间存在一些相关性，如：奥陶纪大辐射事件和石炭纪-二叠纪的生物多样化事件均与气候变冷相关；　中-晚泥盆世生物大灭绝事件与该时期古温度变化相关。生物的演化与环境的变迁经常是彼此联系的。为了探究两者之间的关系，科学家团队将一些关键环境指标参数与新的多样性曲线进行了初步的比较，发现生命的兴衰与大气中二氧化碳含量的变化存在同步的现象，二氧化碳含量高，生物多样性通常也较高，二氧化碳含量变低，生物多样性也会变低。目前尚不清楚究竟是什么机制将这两种变化联系在了一起，但相信随着研究的不断深入，比如未来收集了环境变化的大数据，就可以去尝试揭秘这两者之间的真正关系了。地球生命演化有着无穷的奥秘，利用大数据绘制出高分辨率的生物多样性曲线不过是第一步。随着大数据、人工智能等新技术手段的应用，科学家们将会不断揭示地球生命演化的奥秘。（原标题：大数据揭秘3亿年生命演化）来源：北京日报作者：樊隽轩流程编辑：L020　

展开

碣滑有实

作国产数据库引领者！CirroData亮相第十一届中国数据库技术大会

2020年12月21日，由IT168旗下ITPUB企业社区平台主办的第十一届中国数据库技术大会（DTCC2020）在北京国际会议中心隆重召开。会议以“架构革新，高效可控”为主题，邀请了国内数据库领域的顶级专家围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和讨论。东方国信CirroData数据库受邀在会上发表题为《金融行业企业级数据架构变革规划及落地实践》的演讲，并接受记者采访。会议首日，东方国信金融事业部技术总监陈志刚发表演讲。陈志刚认为新一代MPP数据库是未来企业级数据平台的首选，基于新一代MPP数据库可整合传统的ODS、数据仓库、数据湖、数据集市，对传统企业级数据架构进行变革，建立企业级数据平台。之后，陈志刚介绍了东方国信自主研发的新一代MPP数据库 —— CirroData金融级分布式数据库，并通过介绍CirroData替换TD、Hive、Impala、Oracle、某国产数据库的案例，提出了基于CirroData的迁移方案和面向企业应用的研发能力。最后，陈志刚提出企业的业务系统中心化趋势，认为信息化程度高的企业将完成企业数字化转型的双引擎架构。CirroData分布式数据库研发中心总经理金正皓接受了ITPUB记者采访。金正皓就当前国内外数据库行业发展情况，CirroData数据库的产品定位和技术特色，以及未来趋势进行了介绍。具体采访内容稍后发布。CirroData数据库也凭借产品的技术创新优势，获得了本次大会颁发的“年度创新企业”奖。在之后两天的会议中，CirroData也会在大会现场和与会者进行更为深入和广泛的沟通交流，期待您的莅临垂询！CirroData是北京东方国信科技股份有限公司自主研发的一款面向海量数据分析型应用领域的分布式云化数据库。采用了先进的计算和存储分离的技术架构，融合了分布式存储和MPP并行计算的各自优势，不但可以轻松实现云平台上的伸缩扩展能力，而且可以提供随需部署的能力，是新一代云数据仓库的典型代表。CirroData能满足PB级海量数据的存储和分析，这些数据可以分布在数百台通用服务器上，能够被数千并发用户高速访问，可以满足数据密集型行业日益增大的海量数据存储、高性能加工，在线分析、即席查询和高并发访问的需求。

展开

到读国外的博士中业的考研考研日语等级研究生招生人数每年土木专业考研学校开封考研培训班哪个培训班考研英语培训化学工程与技术考研学校排名一览预防医学考研可以转什么专业 2020考研成绩什么时候出啊国际贸易考研试题茶学考研院校排名考研考教学与课程论肖秀荣考研政治状院校应用心理学考研究生研究生学费怎么算

首页

考研

考博

院校选择

专业选择

研究生动态

研究生题库

数据库自主研发

陆金所数据库管理实现自主化，智能化工具立大功

国产数据库大有可为

再次打破国外技术垄断！最强国产数据库诞生：华为、中兴、阿里上榜

达梦四十年磨一剑撑起数据库自主旗帜

十年磨一剑，中国打造国产数据库

国产数据库大有可为——访北京东方国信科技股份有限公司分布式数据库研发中心副总经理李晓光

发展国产数据库大有可为

创意信息：目前公司以数据库产品为主的自主可控产品研发在继续投入中

南大专家团队自主研发人工智能算法，用大数据揭秘3亿年生命演化

作国产数据库引领者！CirroData亮相第十一届中国数据库技术大会

首页

考研

考博

院校选择

专业选择

研究生动态

研究生题库

数据库自主研发

陆金所数据库管理实现自主化，智能化工具立大功

国产数据库大有可为

再次打破国外技术垄断！最强国产数据库诞生：华为、中兴、阿里上榜

达梦四十年磨一剑 撑起数据库自主旗帜

十年磨一剑，中国打造国产数据库

国产数据库大有可为——访北京东方国信科技股份有限公司分布式数据库研发中心副总经理李晓光

发展国产数据库 大有可为

创意信息：目前公司以数据库产品为主的自主可控产品研发在继续投入中

南大专家团队自主研发人工智能算法，用大数据揭秘3亿年生命演化

作国产数据库引领者！CirroData亮相第十一届中国数据库技术大会

达梦四十年磨一剑撑起数据库自主旗帜

发展国产数据库大有可为