摘要: ClickHouse row_number() over (partition by)的几种实现方法 hive中有row_number() over (partition by)函数,可以一句SQL实现想要的排序,在ClickHouse中有很多种实现方式,本篇就介绍一下几种方法。 目录 1.row_ 阅读全文
posted @ 2021-06-05 16:26 宁君 阅读(1484) 评论(1) 推荐(1) 编辑
摘要: ClickHouse为用户提供了丰富的多参聚合函数(parametric aggregate function)和基于数组+Lambda表达式的高阶函数(higher-order function),将它们灵活使用可以达到魔法般的效果。在我们的体系中,ClickHouse定位点击流数仓,所以下面举几 阅读全文
posted @ 2021-06-05 16:22 宁君 阅读(730) 评论(0) 推荐(0) 编辑
摘要: 数据类型 尽量用数值型 建表时能用数值型或日期时间型表示的字段,就不要用字符串——全String类型在以Hive为中心的数仓建设中常见,但CK环境不应受此影响。 直接用DataTime 直接用DateTime表示时间列,而不是用整形的时间戳。因为CK中DateTime的底层就是时间戳,效率高,可读性 阅读全文
posted @ 2021-06-05 16:21 宁君 阅读(2440) 评论(0) 推荐(0) 编辑
摘要: 利用Grafana与系统表监控ClickHouse查询 前言 我们往往需要关心数据库的查询执行情况,特别是慢查询。本文简述配置ClickHouse查询监控的一种傻瓜方法。 开启查询日志 打开各个ClickHouse实例的users.xml,在当前使用的profile(如default)中加入: <l 阅读全文
posted @ 2021-06-05 16:19 宁君 阅读(1030) 评论(0) 推荐(0) 编辑
摘要: 当前连接数 SELECT * FROM system.metrics WHERE metric LIKE '%Connection'; 当前正在执行的查询 SELECT query_id, user, address, query FROM system.processes ORDER BY que 阅读全文
posted @ 2021-06-05 16:18 宁君 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 一、去重 1.arrayDistinct 对数组进行去重 SELECT arrayDistinct( [1,2,3,6,34,3,11]) 2.arrayUniq 计算数组中有多少个不重复的值 SELECT arrayUniq( [1,2,3,6,34,3,11]) 3.arrayCompact 对 阅读全文
posted @ 2021-06-05 16:16 宁君 阅读(2015) 评论(0) 推荐(0) 编辑
摘要: 库引擎 MySQL引擎 允许连接到远程MySQL服务器上的数据库,并执行INSERT和SELECT查询以在ClickHouse和MySQL之间交换数据。 Mysql数据库引擎翻译请求语句,并发送给MYSQL服务器,因此你可以执行像SHOW TABLES 或者 SHOW CREATE TABLE这样的 阅读全文
posted @ 2021-06-05 16:15 宁君 阅读(627) 评论(0) 推荐(0) 编辑
摘要: OLAP 读多于写 不同于事务处理(OLTP)的场景,比如电商场景中加购物车、下单、支付等需要在原地进行大量insert、update、delete操作,数据分析(OLAP)场景通常是将数据批量导入后,进行任意维度的灵活探索、BI工具洞察、报表制作等。 数据一次性写入后,分析师需要尝试从各个角度对数 阅读全文
posted @ 2021-06-05 16:14 宁君 阅读(783) 评论(0) 推荐(0) 编辑
摘要: 下载 下载地址: https://repo.clickhouse.tech/tgz/stable/ 下载的包: clickhouse-common-static clickhouse-server clickhouse-client 单机安装 tar -zxvf clickhouse-common- 阅读全文
posted @ 2021-06-05 16:13 宁君 阅读(185) 评论(0) 推荐(0) 编辑