企业打开云HBase的正确方式,来自阿里云云数据库团队的解读
一、HBase的历史由来
HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。
在大批知名公司的推动下,以及结合HBase自身的能力,HBase应用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域。
二、HBase普及和应用难点
整个Hadoop技术体系也不知不觉的走过了10年的青葱岁月,但相比关系型数据库超过40年的发展,还显得稚嫩。相比成熟的关系型数据库,HBase的普及和应用,有以下难点:
- 生产部署至少4个节点,起步成本高。
- 原始只有API接口,偏底层,需要较强编程功底。
- 技术资料少。
- 社区活动少。
三、技术平民化,阿里云HBase团队在行动
为了普及和推广HBase生态,降低HBase使用难度,让更多的公司享受到HBase技术红利。
阿里云HBase团队在产品,生态,客户服务方面积极投入,希望通过微薄的力量造福整个中国HBase技术生态,让HBase技术平民化,让那些只有大公司才玩的起的技术真正走进SME,校园和广大开发者。
1、推出云HBase单节点版本,极低成本,降低使用门槛
阿里云云HBase服务正式推出单节点版本,欢迎访问https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多。
HBase单节点版本是在集群版本的基础上推出的基础版本,相比集群版本的4个节点起步,单节点版本HBase服务全部部署在一个节点上,因此单节点版本价格非常低。同时单节点是具备小规模生产能力的,具备纵向伸缩能力,提供11个9的数据集可靠性和2个9的服务可用性,所以单节点版本非常适合开发、测试以及非核心业务小规模生产环境。
HBase单节点有以下特点:
- 体验一致 :和云数据库HBase集群版本各种操作,监控体验一致
- 低成本 :年度爆款,99元/3月,399元/年
- 高性能:深度内核优化,性能高于社区版本50%-200%
- 弹性灵活:多种规格选择,未来支持实例升级变配,选择灵活
2、提供SQL能力,造福广大DBA和开发者
过于底层的API,使得HBase使用起来难度巨大。相比原生API,SQL能力是广大DBA和开发者提升开发和使用效率的利器,云HBase服务默认包含Phoneix服务。
Phoenix是一个开源的HBASE SQL层。它不仅可以使用标准的JDBC API替代HBASE client API创建表,插入和查询HBASE,也支持二级索引、事务以及多种SQL层优化。
另外,我们在云栖社区中推出一系列专业文章,帮助HBase用户很好的理解和使用HBase和Phoenix:Phoenix系列文章。此系列文章将会从Phoenix的语法和功能特性、相关工具、实践经验以及应用案例多方面从浅入深的阐述。希望对Phoenix入门、在做架构设计和技术选型的同学能有一些帮助。
另外,功能更强大和完善的HBase SQL能力也持续研发中,HBase使用难度会进一步降低,适应场景更加广泛。
3、回馈社区,积极推动社区发展
阿里由于业务上的需要,内部深度使用HBase,内部集群规模整体超过12000台,单集群超过1000台。在长期的实践和使用中,也培养了大量的专家,积累了雄厚的技术实力,目前拥有 3 HBase PMC、6 Committer、数十位内核贡献者。我们在收获社区的技术支持的同时,也积极回馈社区,给社区贡献超过 200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。除了产品上,我们在社区的推广和建设中也积极投入人力和物力。
- 主办Apache HBasecon Asia 2018大会
HBaseCon大会是Apache HBase™官方举办的技术会议,发起于2012年,是HBase技术人员的盛会。阿里云主办2018届HBase亚洲大会,大会预计在下半年举行,我们会在第一时间公布在技术社区中。欢迎广大HBase技术爱好者关注。
- 打造HBase中文社区,完善HBase中文资料
HBase发源于美国,发源于社区,所以存在资料不完善,核心资料都是英文的问题,进一步加大了开发人员学习和掌握HBase的难度。
云HBase团队联合国内众多大公司的研发leader,HBase社区PMC,推出HBase中文社区,打造一个技术人员的技术交流家园,组织广大的社区爱好者积极分享HBase技术文章,共同促进HBase技术氛围的形成。也欢迎更多的同学加入HBase技术社区,一起营造HBase技术家园。
4、一颗公益之心,义务抢救客户数据
4.13日,某公司使用自建一个HBase集群挂了!整个集群有30+T 业务数据,是公司的数据中心,集群直接启动不了。他们也是经历了熬战一天一夜的情况下,依旧没有解决恢复,还曾有过重装集群重导数据念头。最后,通过钉钉HBase技术交流群找到阿里云的技术团队同学。技术同学立刻自发组成抢救小分队,尽力最大的努力,使用最低风险的方式,抢救最完整的集群。
事后,技术负责人王华激动的表示:非常感谢阿里大牛的帮助,协助我们解决了关键问题,避免了30TB业务数据遗失的重大损失。
感谢这群单纯的技术人,让HBase技术社区有温度!
四、写到最后
一项技术的发展和成熟,都要经历无数的技术人员,无数个日夜,不眠不休持续奋战。也需要集全社会的力量,更多的公司一起参与进来共同打造更好的产品和更好的生态。
阿里云HBase团队希望通过这些星星之火,点燃HBase以及整个Hadoop技术生态的草原。
普及HBase,阿里云HBase团队在行动!
本文作者:所在jason