clickhouse的mergetree家族系列引擎网络资料整理

这里首先先备注一些常用的引擎特性,具体的可以去下方网络链接去查看

ReplacingMergeTree

➢实际上是使用 order by 字段作为唯一键

➢ 去重不能跨分区

➢ 只有同一批插入(新版本)或合并分区时才会进行去重

➢ 认定重复的数据保留,版本字段值最大的

➢ 如果版本字段相同则按插入顺序保留最后一笔

SummingMergeTree

➢ 以 SummingMergeTree()中指定的列作为汇总数据列

➢ 可以填写多列必须数字列,如果不填,以所有非维度列且为数字列的字段为汇总数

据列

➢ 以 order by 的列为准,作为维度列

➢ 其他的列按插入顺序保留第一行

➢ 不在一个分区的数据不会被聚合

➢ 只有在同一批次插入(新版本)或分片合并时才会进行聚合

mergetree引擎链接

如果要在集群中建立副本,为了数据的安全性,那么在副本上建立表要声明各种mergetree引擎的replicated版本,下图这些副本引擎

(clickhouse是去中心化的,不是一主多从,而是人人平等)

 

posted @ 2022-06-08 21:40  习惯了蓝  阅读(43)  评论(0编辑  收藏  举报