分布式数据库的二级分区
一级分区只能按照一个维度进行数据的划分,而很多互联网流水业务都需要按两个维度划分数据:一个维度是时间,数据是按照时间顺序生成的;另外一个维度是用户。
这时候就能使用OceanBase的二级分区的方式来划分数据,时间维度用RANGE分区,用户ID用HASH分区。
二级分区的每一级分区方式与一级分区方式相同,只是第二级的分区是在第一级分区的基础之上再进行一次分区划分。如下history_t表按一级HASH划分3个分区,每个一级分区按时间RANGE COLUMNS划分为4个分区,总共有12个分区。
备注:这个 阿里的OceanBase 目前自己还不了解;例如kudu也可以做二级分区,先按某个字段hash,再按时间字段做range分区。
-----------专注于实时数仓,大数据存储、计算