clickhouse的mergetree家族系列引擎网络资料整理
这里首先先备注一些常用的引擎特性,具体的可以去下方网络链接去查看
ReplacingMergeTree
➢实际上是使用 order by 字段作为唯一键
➢ 去重不能跨分区
➢ 只有同一批插入(新版本)或合并分区时才会进行去重
➢ 认定重复的数据保留,版本字段值最大的
➢ 如果版本字段相同则按插入顺序保留最后一笔
SummingMergeTree
➢ 以 SummingMergeTree()中指定的列作为汇总数据列
➢ 可以填写多列必须数字列,如果不填,以所有非维度列且为数字列的字段为汇总数
据列
➢ 以 order by 的列为准,作为维度列
➢ 其他的列按插入顺序保留第一行
➢ 不在一个分区的数据不会被聚合
➢ 只有在同一批次插入(新版本)或分片合并时才会进行聚合
如果要在集群中建立副本,为了数据的安全性,那么在副本上建立表要声明各种mergetree引擎的replicated版本,下图这些副本引擎
(clickhouse是去中心化的,不是一主多从,而是人人平等)