上一页 1 2 3 4 5 6 7 8 ··· 33 下一页

2022年5月9日

ClickHouse-数据一致性

摘要: 在生产环境中,数据一致性的重要性,不论如何强调都不过分。而 ClickHouse 在进行数据变更时,都会产生一个临时分区,而不会更改原始数据文件,对数据文件的修改操作会要等到数据合并时才进行。所以 ClickHouse 只能保证数据的最终一致性,而不能保证强一致性。很可能数据变更后,程序通过 Cli 阅读全文

posted @ 2022-05-09 22:14 嘣嘣嚓 阅读(897) 评论(0) 推荐(0) 编辑

2022年4月26日

ClickHouse-查询优化

摘要: 一、单表查询【使用的频率高】 1.prewhere代表where Prewhere 和 where 语句的作用相同,用来过滤数据。不同之处在于 prewhere 只支持*MergeTree 族系列引擎的表,首先会读取指定的列数据,来判断数据过滤,等待数据过滤之后再读取 select 声明的列字段来补 阅读全文

posted @ 2022-04-26 23:08 嘣嘣嚓 阅读(384) 评论(0) 推荐(0) 编辑

2022年4月21日

ClickHouse-语法优化规则

摘要: ClickHouse 的 SQL 优化规则是基于 RBO(Rule Based Optimization),下面是一些优化规则 以下规则中使用了ClickHouse官方测试数据集,数据集使用步骤移步这里。 1.COUNT优化 在调用 count 函数时,如果使用的是 count() 或者 count 阅读全文

posted @ 2022-04-21 23:10 嘣嘣嚓 阅读(193) 评论(0) 推荐(0) 编辑

ClickHouse-官方数据集使用

摘要: 参考:https://clickhouse.com/docs/en/getting-started/example-datasets/metrica/ 准备clickhouse官方数据集 https://clickhouse-datasets.s3.yandex.net/hits/tsv/hits_ 阅读全文

posted @ 2022-04-21 23:04 嘣嘣嚓 阅读(330) 评论(0) 推荐(0) 编辑

2022年4月20日

ClickHouse-优化(建表、配置)

摘要: 1.数据类型 1.1时间字段的类型 建表时能用数值型或日期时间型表示的字段就不要用字符串,全 String 类型在以 Hive为中心的数仓建设中常见,但 ClickHouse 环境不应受此影响。 虽然 ClickHouse 底层将 DateTime 存储为时间戳 Long 类型,但不建议存储 Lon 阅读全文

posted @ 2022-04-20 22:58 嘣嘣嚓 阅读(805) 评论(0) 推荐(0) 编辑

ClickHouse-Explain执行计划

摘要: 在 clickhouse 20.6 版本之前要查看 SQL 语句的执行计划需要设置日志级别为 trace 才能可以看到,并且只能真正执行 sql,在执行日志里面查看。在 20.6 版本引入了原生的执行计划的语法。在 20.6.3 版本成为正式版本的功能。 1.基本语法 EXPLAIN [AST | 阅读全文

posted @ 2022-04-20 21:59 嘣嘣嚓 阅读(374) 评论(0) 推荐(0) 编辑

2022年4月13日

ClickHouse-分片集群

摘要: 副本虽然能够提高数据的可用性,降低丢失风险,但是每台服务器实际上必须容纳全量数据,对数据的横向扩容没有解决。 要解决数据水平切分的问题,需要引入分片的概念。通过分片把一份完整的数据进行切分,不同的分片分布到不同的节点上,再通过 Distributed 表引擎把数据拼接起来一同使用。 Distribu 阅读全文

posted @ 2022-04-13 21:35 嘣嘣嚓 阅读(387) 评论(0) 推荐(0) 编辑

2022年4月12日

ClickHouse-副本

摘要: 副本的目的主要是保障数据的高可用性,即使一台 ClickHouse 节点宕机,那么也可以从其他服务器获得相同的数据。 1.副本写入流程 2.配置步骤 (1)启动 zookeeper 集群(Node1-3) 配置zookeeper环境 (2)clickhouse准备两个节点 Node1, Node2 阅读全文

posted @ 2022-04-12 21:27 嘣嘣嚓 阅读(247) 评论(0) 推荐(0) 编辑

2022年4月7日

ClickHouse-SQL语法

摘要: 1.insert 基本与标准 SQL(MySQL)基本一致 (1)标准 insert into [table_name] values(…),(….) (2)从表到表的插入 insert into [table_name] select a,b,c from [table_name_2] 2.upd 阅读全文

posted @ 2022-04-07 22:41 嘣嘣嚓 阅读(204) 评论(0) 推荐(0) 编辑

2022年4月6日

ClickHouse-常用表引擎详解

摘要: 表引擎是 ClickHouse 的一大特色。可以说, 表引擎决定了如何存储表的数据。包括: ➢ 数据的存储方式和位置,写到哪里以及从哪里读取数据。 ➢ 支持哪些查询以及如何支持(不同引擎有些功能不能用)。 ➢ 并发数据访问。 ➢ 索引的使用(如果存在)。 ➢ 是否可以执行多线程请求。 ➢ 数据复制参 阅读全文

posted @ 2022-04-06 22:13 嘣嘣嚓 阅读(809) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 33 下一页

导航