蚂蚁金服冯柯:下一个十年,核心自研技术将迎来黄金发展期
2018-05-16 14:53 玲小喵 阅读(309) 评论(0) 编辑 收藏 举报本文根据冯柯老师在2018年5月10日【第九届中国数据库技术大会】现场演讲内容整理而成。
如今,很多行业中的企业都开始考虑发展自研技术,不仅仅是互联网行业。我希望能够借此次机会将蚂蚁金服多年来在发展自研技术方面的实践与思考分享给大家,希望能够带给行业一些启发。
1995年,我第一次加入高校的实验室,当时选择的是数据库方向。之后八年,我一直在做工程数据库方面研究的工作。
2003年,当时国家给了我们一个很好的机会,我们就在思考是否可以借此将目前的技术商业化,之后就做了11年。
回顾蚂蚁金服整个自研技术多年的发展历程,我们发现有三个问题是非常重要的,换句话说,今天的企业想要发展自研技术需要先思考这三个问题:
了解OceanBase发展史的朋友应该都知道,我们团队在历史上几次面临关键时刻都得到了贵人相助,而这些贵人就是当时在关键位置上的决策者。如果没有决策者的担当,那么蚂蚁金服的自研数据库团队早就不复存在。
此时,业务团队选择相信我们,然而我们团队的压力空前巨大,如果双11当天数据库中的数据出现问题,这会对蚂蚁金服产生很严重的后果。幸运的是,我们最后扛过来了。
首先,从扩展能力看,由于核心业务只能被部署在活跃的数据中心,所以该方案无法解决核心业务跨城市扩展问题。换句话说,从业务角度来看,两地三中心的本质是同城双活;
其次,从成本来看,由于灾备中心只在极端容灾场景下被启用,所以整个系统的资源利用率较低,相对应的成本就会升高;
最后,从容灾能力来看,整个系统正常运作时,灾备中心始终处于冷备模式,所以系统容灾时可用性较低,容灾切换风险较高。
因此,在两地三中心的架构下,如果真的发生城市级故障,我们通常也不敢把业务切到灾备中心,只能等待故障的数据中心恢复,在这个过程中,系统是无法提供服务的。
一是自包含性:比如账户充值交易所涉及的所有计算和数据都会被封闭在一个单元;
四是容灾性:单元之间相互备份,每个单元都保证在发生同城或异地故障时有可接管的单元,单元之间的备份方式是使用自研数据库提供的多地多中心的一致性方案。
从两地三中心到三地五中心,我们解决了一个基础又非常重要的问题,即便发生城市级故障,整个城市都不可用,数据库层面仍然可以做到,系统不丢数据,不停服务。
最重要的是,我们提升了系统面对城市级故障的能力。蚂蚁金服在如此大规模的金融交易系统中实现了这样的容灾能力,这在世界上属于首创。
我们相信,下一个十年,自研技术特别是核心自研技术将会迎来真正的黄金发展期,这背后存在深刻的行业背景和成熟的企业实践。
在这里,我们想借DTCC这个平台,呼吁所有人,呼吁所有志同道合者,包括媒体界的各位朋友,与我们一起去亲身经历这下一个时代,共同为自研技术喝彩,为科技自信代言!