随着数字化转型,大量的业务都需要使用数据库,这便对数据库的处理能力形成巨大的挑战。比如基于中间件的分库分表方案解决了扩展性的问题,但是跨库事务、全局一致性、负载均衡、复杂SQL仍然成为亟待解决的问题。
而原生分布式数据库的出现,因其具有灵活的部署方式和负载均衡能力,则解决了数据库处理能力横向线性扩展问题。说到企业级原生分布式数据库代表,就不得提到OceanBase,在过去一年中,有包括红象云腾在内的50多家企业用OceanBase进行了开源实践,那么效果如何呢?
跟随OceanBase积累经验,红象厚积薄发
2021年6月,OceanBase选择向全网开源。不同于遮遮掩掩式的“公关式开源”,OceanBase这次放了狠招:他们一次公开了自己全部内核。也正因为如此,红象云腾方表示,“现在拿不出特别充足的预算去支持商业版,但是我们也希望能用上 OceanBase 的技术,开源路线出来之后我们就大胆的去用了。”
红象本身主要是做分布式大数据业务场景,以前用的是 MySQL,现在用 OceanBase 来替代 MySQL 集群承担业务报表。当数据运算完成后把结果存到一个结果数据库里面,OceanBase 承担面向应用端来提供服务的角色。
红象还有一些使用了各种数据库的业务。以前,他们会把这些数据录到 Hadoop 里面建个 hive 表,再供业务使用,整个流程非常复杂,用户使用起来也很累。现在,直接把数据直接录到 OceanBase 里面,再对外提供服务。架构非常简单,可以很方便解决客户问题。
总结下来,以前红象做事情喜欢做加法,但接触了OceanBase开源后便开始做减法。目前红象仅靠Hadoop + OceanBase,就能点亮新能源大数据 ,目前他们的集群情况,也都是小集群:3个 kafka,8个Hadoop 管理节点加数据节点,6个 OceanBase节点,支撑10万个点位数据。
但随着数据量越来越大,OceanBase 在该业务扮演的角色会越来越重要,核心功能会体现的淋漓尽致,比如弹性扩缩容,HTAP 能力等。
OceanBase五大技术优势,助力红象
红象云腾是一家专注于 Apache Hadoop 生态的大数据软件厂商,主要产品是红象云腾大数据基础平台(Redoop Enterprise V9.0),产品由 CRF 数据接入,CRH 数据存储,CRS 数据分析三大部分构成。而此次选择OceanBase,也是基于这五大技术优势:
第一,技术匹配。红象在选择数据库时,不但要求具备分布式、高可用特点,而且还要线性可扩展,这是他们对于选型数据库的要求,OceanBase 符合其需求。
第二,兼容性强。OceanBase 对 MySQL 的兼容性很好,红象很多应用程序可以直接移植到 OceanBase 环境而不需要改太多代码。
第三,技术支持度高。在红象使用 OceanBase 过程中,其表示OceanBase 社区团队对他们的支持力度很大,遇到问题时,社区技术团队能够及时响应和解答。
第四,简洁易用。OceanBase只有一个核心组件 OBServer,而 Hadoop 组件太多了,所以说OceanBase 实现了 Hadoop 里面的很多特性,也实现了很多 Hadoop 里面没有的特性,做到了简洁就是美。
第五,OceanBase开源开放让红象一个旁观者,或者说是使用者,变成一个参与者,这是很重要的身份转变。
OceanBase做的是用户价值,这是他们开源的重要理念。从最早先屈指可数的几个客户,到今天400多家全行业的客户,“让天下没有难做的生意”依然流淌在他们每个人的基因里。
总而言之,对原生分布式数据库未来的数据管理革命,OceanBase基于分区的数据保护方式真正让分布式数据库按需调整,让在线扩容缩容成为现实。相信在未来,OceanBase也将与更多有愿景、有能力的行业伙伴一起共建生态。