2021年6月国产数据库排行榜:OceanBase、PolarDB会师TiDB、openGauss,入局开源阵营,逐鹿生态建设
“首夏犹清和,芳草亦未歇”,时至六月,百花齐放、百家争鸣的国产数据库市场依旧延续着如骄阳般火热的态势。不过从最新一期的 国产数据库流行度排行榜 Top 10 中不难发现,一个词足以成为关注的焦点,那便是 “开源” !在刚刚过去的一周内,PolarDB 和 OceanBase 相继宣布开源。至此,“T-O-P”三强均已加入开源阵营,算上 openGauss,十强之位有其四,数据库的开源大时代正向我们走来。
具体来看本期榜单中十强的排名和分数情况,开源数据库的成绩无疑最为抢眼。首先,openGauss 以高达 64.75 分的单月涨幅,跳升两位来到第 6 名,将同门大哥 GaussDB 和鹅厂的 TDSQL 分别挤下一位;其次,PolarDB 不甘示弱,虽然排名没有变化,但 55.27 分的增长足以让其稳守三强席位,并将与第四名达梦的分差从上个月的 35 分拉大到如今的 132 分;最后,OceanBase 的微涨(原因见后)和 TiDB 的下降使两者间的分差缩小到接近 100 分。这两个类型相似、适用场景有较大重叠、同以金融行业为切入点的热门数据库,想必会在今年下半年为榜首之争展开一番较量。
十强中其他数据库的名次没有变化,分数跌多涨少,笔者推断是这些数据库在5月的市场声量有所降低,加之开源数据库声势浩大,两方面因素叠加造成加权均值被拉升所致。
再来看第 11-15 名,Kingbase、EsgynDB 和 TcaplusDB 都有着不错的表现,实现不同程度的涨分。EsgynDB 和 TcaplusDB 分别跳升两位来到第 12 和 15 名;而 Kingbase 虽然名次没有变化,但在“传统老四家”中实现唯一的正增长,与第 10 名 GoldenDB 的差距缩小到仅 4 分,目标直指跻身十强。
坚持自研开放之路的 OceanBase 正式开源
OceanBase 要开源的消息在业内早有传闻,所有的悬念都在6月1日召开的 “OceanBase 3.0 数据库峰会” 上一一揭晓。在此次峰会上,蚂蚁集团自主研发的分布式数据库 OceanBase 首次从技术、商业和生态三个维度对未来发展战略进行了系统性阐述。同时,OceanBase 宣布正式开源,并成立 OceanBase 开源社区,社区官网同步上线,300 万行核心代码向社区开放。
据了解,开源已经上升为 OceanBase 重要的技术战略。此次开源采用木兰公共协议 MulanPubL-2.0 版,以及业界通用 Open Core 模式。开源范围包含数据库内核、分布式组件和接口驱动,并提供完整的 SQL 引擎、事务引擎和存储引擎,支持多副本、分布式事务、高性能、扩展能力、故障恢复、优化器、多活容灾、语法兼容等核心技术。OceanBase 数据库创始人阳振坤表示,OceanBase 致力于打造企业级开源数据库,同时与合作伙伴一起紧密合作,快速发行商业版本,满足行业客户对数据库高性能、高可靠、融合处理的业务诉求。感兴趣的小伙伴可以去 OceanBase 开源官网 查看、体验更多细节。
尽管 OceanBase 在本月更新的排行榜中仅微涨 0.72 分,但随着“6·1”发布会的召开,相关资讯的集中报道,开源社区的成立以及更多的人关注,笔者相信 OceanBase 在下月更新的排行榜中将有亮眼的表现。
开源的阿里云数据库欲打造云原生分布式数据库生态
在 5 月 29 日召开的 “2021 阿里云开发者大会” 上,阿里云智能数据库产品事业部负责人李飞飞(花名:飞刀)进行了《云原生数据库2.0:一站式数据管理与服务》的主题演讲。在演讲的最后,飞刀重磅发布了阿里云数据库开源计划,携手开源社区一起共建云原生分布式数据库生态。
阿里云作为国内云原生数据库技术的领军企业,成为第一个开源云原生数据库的组织,回馈行业和广大技术爱好者。根据公布的计划:
- 2021 年 6 月开源企业级分布式数据库 PolarDB for PostgreSQL,第一步 6 月发布 Paxos 高可用集群版,在 9 月发布 HLC 高扩展分布式版本,在明年 3 月发布 Sharding 和插件化版本。
- 2021 年 10 月开源云原生 MySQL 数据库 ApsaraDB GalaxySQL,首先在 10 月发布基于 Paxos 高可用的集群版本,在明年 6 月发布云原生分布式版。
阿里云在自身互联网业务和云数据库服务有丰富的实践经验,在高可用、分布式、云原生、存储与计算分离等技术上有深厚积累。如今,阿里云将这些关键技术组件和系统,包括内部 MySQL 分支 AliSQL(目前 RDS 服务的内核)、分布式一致性协议库 X-Paxos、高性价比存储引擎 X-Engine、分布式数据库产品 PolarDB for PostgreSQL 一起开源,可以打造更多的系统解决方案,从而不断完善和丰富云原生分布式数据库的形态,满足更多样化的用户需求,进一步促进整个数据库产业的变革。
飞刀还第一时间公布了 PolarDB for PostgreSQL 的 GitHub地址,感兴趣的同学可以直接 pull 到本地体验。
生态繁荣的openGauss持续构筑企业级内核能力
生态是开源库数据库成功的关键因素。openGauss 一直秉持着共建、共治、共享的生态策略,携手产业链伙伴,最终实现生态共赢。
5 月 26 日的“OSCAR开源先锋日”上,由中国信通院牵头,数十家行业知名企业参与制定的 《可信开源社区评估体系》 标准正式发布。该标准梳理了开源社区开发与治理方面应该关注的内容及指标,为开源社区实现安全、健康、可持续性发展奠定基础。openGauss 经过 OSCAR 专家重重评审、测试 22 道环节,成为首批获得评估的“可信开源社区”。三天后,openGauss Meetup【北京站】在北京中关村智能制造创新中心成功举办,吸引“产学研用”全生态链广泛参与,openGauss 北京城市用户组也随即成立。
可以说,openGauss 开源近一年以来,社区迅速壮大,生态蓬勃发展,围绕企业级性能、企业级安全、企业级可靠等方面持续加强,并在行业加速落地。目前 openGauss 成功支撑邮储银行新一代分布式金融核心系统上线,并成功打造同业领先的金融核心系统;帮助中华人寿团险核心系统使用鲲鹏全栈替换,实现性能倍增;openGauss 基于鲲鹏 4 路服务器的中国移动数据库性能测试排名绝对领先。面向未来,openGauss 将从国计民生行业数据库应用的最紧迫问题和长远需求出发,不断在核心技术上进行突破,将根扎深,共同打造枝繁叶茂的数据库主流生态。
开源先行者TiDB已具备完整HTAP能力
本文重点关注的是“开源”,那么提到开源数据库,就不得不提 PingCAP 的 TiDB。TiDB 从诞生之日起,就把分布式的集群做到了开源的版本里。这对用户来说,带来的价值提升非常高。也正因如此,成立 6 年的 PingCAP 已在金融、运营商、互联网等行业积累了超过 1500 家用户。TiDB 不仅是一款优秀的数据库产品,也成为了整个 TiDB 社区发展壮大的基础支撑。
犹记得一个多月前 TiDB 5.0 发布的时候,强调的一个关键字就是“练内功”。从 4.0 到 5.0,功能上并无太多新增的 TiDB 把专注力用在了对稳定性和性能的持续优化上,而这些恰恰是一个真正的企业级数据库应该追求的能力。
如今,伴随着综合 SQL 与 NoSQL 需求的业务场景不断涌现,使得混合负载 HTAP 数据库成为 IT 界越来越受重视的关键技术。TiDB 5.0 在 TiFlash 的基础上引入了 MPP 架构,在功能上补全了 HTAP 最后一块拼图,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。这标志着 TiDB 已成为一个拥有完整能力的 HTAP 分布式数据库。
在国内开源数据库领域,TiDB 是先行者,已形成完备的社区生态,在国际化方面也比较成功。现在,OceanBase 和 PolarDB 已先后入局开源阵营,加上一年前开源的 openGauss,对 TiDB 而言势必形成挑战;但“物竞天择势必至,不优则劣兮不兴则亡”,这种良性竞争对开源数据库乃至整个数据库产业来说都是好事。
开源成为数据库生态构建的重要力量
与闭源的商业数据库相反,开源数据库是免费的社区数据库,其源代码对外开放,开发人员可以在其原始设计基础上修改或使用。它以较低的成本、丰富的产品和活跃的社区支持为日益复杂的企业需求提供了相应的解决方案。从 DB-Engines 的排名分数看,开源数据库流行度逐年上升,在今年 1 月首次超过了商业数据库。开源势头如此之猛,其背后的原因还是在于数据库生态的构建之争。
(图源:艾瑞咨询)
当前数据库生态可以大致分类三类:一是传统商业数据库,以 Oracle 为代表,其在 40 余年时间里所创造的数据库帝国已拥有了极其完善的生态;二是开源数据库,以 MySQL、PostgreSQL 为代表,遍布全球的社区组织形成了强大的生态系统,也形成了若干分支,成就了诸多商业数据库产品;第三则是国内新兴数据库,以 TiDB、OceanBase、PolarDB 等为代表,具备较强的自研能力,但在生态方面较前两类薄弱很多。如何快速建立并形成符合自身利益的生态呢?开源无疑是一个绝佳的选择。
笔者注意到,不论是 TiDB、OceanBase,还是 PolarDB、openGauss,都不约而同地选择了相对宽松的 Permissive License,这类开源协议允许修改代码后闭源,因此较受商业公司青睐。这里就不得不提到开源的商业逻辑问题——开源的持续发展依赖于技术上的不断创新和商业上的良性循环。借助开源,在技术层面可以加速产品创新和迭代演进——“软件是用出来的而非做出来的”,开源汇聚众人智慧,推动产品使用,在功能和性能上不断优化,进而快速形成竞争力;在商业层面,依托开源形成的功能增强、售后支持、市场教育、人才培养、配套工具、品牌影响等都可以直接或间接地形成经济效益,进而促进开发者社区壮大和更多技术创新产生,获得对自己有利的战略地位。
因此,这也就解释了为什么大厂纷纷入局开源生态的建设。如今,随着 TiDB、OceanBase、PorlaDB、openGuass 等纷纷加入开源阵营,相信未来国内新兴数据库生态将会快速成长、茁壮成长,也会带动国内整个数据库产业向前发展。
各显其能,共推国内数据库产业蓬勃向前
相较于开源阵营的风生水起,国内的一些数据库厂商则显得有些低调。其实这只是大家所侧重的商业模式或业务重心不同罢了,闭源的数据库产品同样值得关注。5 月 10 日,德本咨询/eNet研究院/互联网周刊发布 《2021信创数据库企业排行》,15 家数据库企业上榜,达梦数据库以 0.02 分的优势排名第一,紧随其后的是另外三大传统数据库厂商:人大金仓、南大通用和神舟通用,巨杉数据库位列第五。
根据海比研究院的数据显示,2020 年我国信创生态市场规模为 1617 亿元,未来五年将保持高速增长,年复合增长率为 37.4%,2025 年将达到 8000 亿元规模。通过持续发展,信创可以成为重塑中国信息化、数字化市场重应用、轻技术传统格局的突破力量,促使其进入技术驱动型市场。而这其中,作为基础软件的数据库正是技术驱动的中坚力量。
本期数据库流行度排行榜已收录 131 个国内数据库产品,不论规模大小、排名先后,大家都在为国内数据库产业的蓬勃发展贡献自己的力量。限于篇幅,笔者不在此罗列5月国产数据库的大事记和重要产品发布消息了,墨天轮的小编已为大家整理好,感兴趣的朋友可以点此查看。
相关链接:
墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。
关注官方公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯