11月25日,达梦召开2020创新产品发布会。会上,达梦发布了达梦数据共享集群、达梦启云数据库、达梦新一代分布式数据库、梦图数据库四款新产品,与合作伙伴回溯了艰辛的发展历程,分享了合作中的酸甜苦辣。当下,国内很多公司引进国外源码包装成国产,或基于开源数据库进行二次开发,其中甚至不乏市值破千亿的明星公司。相比于引进开源或国外源码这种短平快的发展模式,达梦则始终坚持自主原创,四十年磨一剑。在数据库领域,撑起了数据库自主创新旗帜。

达梦四十年磨一剑终成国产化数据库领导者

上世纪70年代末,武钢热轧车间花费巨资从日本引进了一套无人值守管理系统。为了防止技术泄密,日本人在调试安装完设备后,把足足三卡车的技术资料当场销毁。在现场目睹了这一幕的冯裕才痛下决心,一定要研发出中国人自己的数据库系统。

当时,甲骨文、微软、IBM等数据库产品尚未进入我国,在没有国外产品可以参考的情况下,冯裕才潜心研究,用了8年时间终于开发出第一套数据库管理系统CRDS,在之后的几年里多次在科技部国产数据库招标中名列第一,并承接了一批图形数据库、标准数据库、地图数据库项目。2000年,达梦公司正式成立,开始迈出商业化的第一步。

商业市场既波澜壮阔,也充满暗礁漩涡。由于习惯于在象牙塔中搞研发,对于资本运作不甚了解,加上同时期甲骨文、微软、IBM等外商的产品在国内横行无阻,达梦的商业化之路非常曲折,公司差点倒闭,冯裕才一度想转型系统集成商,不卖数据库产品,而是搭成一套应用系统卖。最艰难的时候冯裕才自己掏钱给员工发工资。很多时候,达梦往往成为竞标中的陪跑者,成为招标单位用来和外商杀价的工具。

当达梦逐渐适应市场后,国内一些公司引进国外开源技术,或是买IBM公司的源代码,在一些技术指标上把达梦挤下去。其实,自达梦公司成立以来,有从美国留学回来的学生想把美国公司的源代码直接卖给达梦,也有美国公司想收购冯裕才的技术团队,还有人呼吁达梦放弃自主研发,也采用免费的开源技术。面对拿来主义、外资收购、开源技术等诱惑,达梦咬定青山不放松,始终坚持自主研发,自己掌握核心技术。

目前,上海浦东新区数据中心、武汉市政府投资项目监管平台、广州市信息化服务中心数据中心、重庆市政法系统信息共享平台、、中铁建财务共享平台、吉林财政国库集中支付、建设银行业务收发文应用平台、人民银行湖北分行金融基础信息查询系统、武汉住房公积金核心业务系统、国家智能电网调度指挥系统D5000、南方电网OS2地级主站系统、泰国教育云平台等项目均采用达梦数据库,历经40年的磨炼,达梦成为最纯粹的国产化数据库的领导者。

十二年如一日填补技术空白

数据共享集群是在多台服务器上构建高可用性数据库系统的最佳解决方案,也是数据库领域技术的制高点,是商业数据库技术的皇冠,这项关键的核心技术在我们的金融、电力、运营商等核心重点的行业市场占有率超过了60%。在最近几年“开源运动”和分布式数据库、NoSQL数据库如火如荼的大背景下,共享集群在重点行业的地位依然无可替代,因为无论技术的风口怎么在变,共享集群的价值无可替代,并仍然被用户广泛的认可。

达梦数据共享集群的关键技术也不是一蹴而就的。2008年,国家电网提出数据共享存储集群的相关需求。2012年,达梦实现两个节点,两台服务器共享集群的关键技术。不过,这对于达梦而言,只是完成了0到1的突破。拿到了入场门票后,还有更多的工作要做,因为用户需要的是一款成熟的产品,后面还有99%的工作需要我们继续去努力。

在过去几年里,达梦数据库在共享集群的几个方面做了持续改进:

一是规模。诚然,国外的共享集群在实际应用当中绝大多数都是两个节点打以天下,四个节点用的都不是特别多,但一款商品要想在市场上被广泛接受,就必须有应对所有场景的能力。目前,达梦数据共享集群做到了从两个节点到八个节点规模的支持,并且通过了第三方机构的测试,后续还会继续向16个节点的规模去做演进。

二是服务中断的时间问题。对于关键核心的业务用户非常关注,如果以5个9的指标来考量,每年发生一次故障,数据库可以用于故障处理的时间是5分钟,如果故障发生频率提高每个月一次,留给数据库的时间就是25秒。也就是换句话说,以5个9为目标,共享存储集群如果能够做到每次故障切换时间控制在25秒以内,就能够承受每月发生一次系统故障。为了达到这个目标,达梦通过理论分析,确定了共享存储集群架构在故障切换时间方面的理论性优势,通过持续优化,将故障切换时间从以前的冷备方案的小时级,改进优化到共享集群的10秒到30秒的速度,基本上完成了5个9的技术要求

三是数据容灾。达梦可以向用户提供从50公里级到1000公里级,以及两地三中心的容灾解决组合方案。在本地或者是在同城基于达梦数据守护技术和达梦数据共享集群进行组合,可以实现RPO为0的超级容灾。在1000公里级的容灾,基于达梦的实时同步技术,可以实现延时为秒级的数据容灾。上面两项技术的组合,还可以构建两地三中心的容灾解决方案。

四是性能。达梦单机四节点的共享集群TPC—C值超过了200万,八节点超过了300万,具有不错的横向扩展能力。可以说,在TPC—C90%操作都是写操作的业务产品,对于集中式架构而言是一个突破。

五是存储管理。达梦进一步改进了存储管理系统,引入了在裸设备之外引入了快设备方式的存储管理,并且提供了存储条带化功能。这两项特性的引入能够更好的提供运维便利性和性能表现。

六是平台支持。实现了对各种主流CPU的全面支持。由于过去只有少数美国公司掌握这项关键技术,数据共享集群此前从来没有在国产CPU上面跑起来,达梦实现了网信名录内所有国产CPU均支持。南京某首个基于国产CPU+共享存储集群的上线业务系统就是采用了达梦的数据库。在浙江电网共享存储集群支撑了电网的核心业务系统,事关到5000万人的正常生产和生活的工作,这个系统也是基于达梦数据库。

这里有一个测试的数据,在一个写入操作达到了50%比例的仿真测试场景当中,在四节点规模的集群下面实现了90%操作的响应时间,不超过1秒,并且吞吐量达到了每秒3000笔业务的成绩。

过去,在全世界只有甲骨文、IBM等个别美国公司掌握这项技术,而且没有开源的技术可以参考,这从侧面可以印证这项技术的基础难度。达梦经过12年的积累,终于掌握了这项关键技术,实现与国外的数据库产品同台竞技。相对于那些只会引进国外源码或拿开源代码做修改的公司而言,达梦12年如一日填补国内空白,是尤为可贵的。

相关文章