clickhouse学习笔记

一、query相关

1. 展示正在处理的请求列表

show processlist

2. 杀掉正在处理的查询

KILL QUERY WHERE query_id='2-857d-4a57-9ee0-327da5d60a90'

  

二、修改名称

-- 1. 重命名
RENAME DATABASE|TABLE|DICTIONARY name TO new_name
-- 2. 交换2个表的名称
EXCHANGE TABLES [db0.]table_A AND [db1.]table_B

 

三、数组函数

-- 1.检测输入的数组是否空
empty([x])
-- 2.检测输入的数组是否非空
notEmpty([x])
-- 3.获取数组长度
length([x])
-- 4.返回一个以step作为增量步长的从start到end - 1的整形数字数组
range(start, end, step)
-- 5.合并参数中传递的所有数组
SELECT arrayConcat([1, 2], [3, 4], [5, 6]) AS res
-- 6.根据索引查找元素
arrayElement(arr,n),运算符arr[n]
-- 7.检查’arr’数组是否具有’elem’元素
has(arr,elem)
-- 8.检查一个数组是否是另一个数组的子集
hasAll(set, subset)
-- 9.检查两个数组是否存在交集
hasAny(array1, array2)
-- 10.检查 array2 的所有元素是否以相同的顺序出现在 array1 中。当且仅当 array1 = prefix + array2 + suffix时,该函数将返回 1。
hasSubstr(array1, array2)
-- 11.返回数组中第一个’x’元素的索引(从1开始),如果’x’元素不存在在数组中,则返回0
indexOf(arr,x)
-- 12.返回结果为非零值的数量
arrayCount(func, arr1)
-- 13.返回数组中等于x的元素的个数
countEqual(arr,x)
-- 14.从数组中删除最后一项
arrayPopBack(array)
-- 15.从数组中删除第一项
arrayPopFront(array)
-- 16.添加一个元素到数组的末尾
arrayPushBack(array, single_value)
-- 17.将一个元素添加到数组的开头
arrayPushFront(array, single_value)
--  18.返回一个子数组,包含从指定位置的指定长度的元素
SELECT arraySlice([1, 2, NULL, 4, 5], 2, 3) AS res
-- 19.以升序对arr数组的元素进行排序。如果指定了func函数,则排序顺序由func函数的调用结果决定
SELECT arraySort([1, 3, 3, 0]);
SELECT arraySort((x) -> -x, [1, 2, 3]) as res;
SELECT arraySort((x, y) -> y, ['hello', 'world'], [2, 1]) as res;
-- 20.以降序对arr数组的元素进行排序。如果指定了func函数,则排序顺序由func函数的调用结果决定
SELECT arrayReverseSort([1, 3, 3, 0]);
-- 21.计算数组中不同元素的数量
arrayUniq(arr, …)
-- 22.计算相邻数组元素之间的差异
SELECT arrayDifference([1, 2, 3, 4]);
-- 23.对数组去重
SELECT arrayDistinct([1, 2, 2, 3, 1]);
-- 24.返回所有数组元素的交集
SELECT arrayIntersect([1, 2], [1, 3], [2, 3]);
-- 25.将聚合函数应用于数组元素并返回其结果
SELECT arrayReduce('max', [1, 2, 3]);
-- 26.将嵌套的数组展平
SELECT flatten([[[1]], [[2], [3]]]);
-- 27.从数组中删除连续的重复元素。结果值的顺序由源数组中的顺序决定。
SELECT arrayCompact([1, 1, nan, nan, 2, 3, 3, 3]);
-- 28.将多个数组组合成一个数组。结果数组包含按列出的参数顺序分组为元组的源数组的相应元素
SELECT arrayZip(['a', 'b', 'c'], [5, 2, 1]);
-- 29.将从 func 函数的原始应用中获得的数组返回给 arr 数组中的每个元素
SELECT arrayMap(x -> (x + 2), [1, 2, 3]) as res;
-- 30.返回一个仅包含 arr1 中的元素的数组,其中 func 返回的值不是 0
SELECT arrayFilter(x -> x LIKE '%World%', ['Hello', 'abc World']) AS res
-- 31.从第一个元素到最后一个元素扫描arr1,如果func返回0,则用arr1[i - 1]替换arr1[i]
SELECT arrayFill(x -> not isNull(x), [1, null, 3, 11, 12, null, null, 5, 6, 14, null, null]) AS res
-- 32.将 arr1 拆分为多个数组。当 func 返回 0 以外的值时,数组将在元素的左侧拆分
SELECT arraySplit((x, y) -> y, [1, 2, 3, 4, 5], [1, 0, 0, 1, 0]) AS res
-- 33.如果 arr 中至少有一个元素 func 返回 0 以外的值,则返回1
arrayExists([func, arr1)
-- 34.如果 func 为 arr 中的所有元素返回 0 以外的值,则返回 1
arrayAll([func, arr1)
-- 35.’arrayJoin’函数获取每一行并将他们展开到多行

 

四、条件函数

-- 1. if
SELECT if(1, plus(2, 2), plus(2, 6))
-- 2. multiIf
multiIf(cond_1, then_1, cond_2, then_2, ..., else)
-- 3. 三元运算
cond ? then : else

  

五、聚合函数

-- 1.返回指定列中近似最常见值的数组
SELECT topK(3)(AirlineID) AS res
FROM ontime
-- 2.

  

六、查看大小

-- 1.查看partition
SELECT partition, formatReadableSize(sum(bytes)) AS size
FROM system.parts
WHERE database = 'your_database' AND table = 'access_local'
GROUP BY partition
ORDER BY partition;

-- 2.查看列的大小
SELECT name, sum(data_compressed_bytes) AS size
FROM system.columns
WHERE database = 'your_database' AND table = 'access'
GROUP BY name
ORDER BY size DESC;
-- 3.查看表的大小

SELECT table, formatReadableSize(sum(data_compressed_bytes)) AS size
FROM system.parts
WHERE active
GROUP BY table
ORDER BY size DESC;

  

七、删除数据

-- 1.删除partition
alter table access_local drop partation '20230901'
-- 2.删除列
alter table access_local clear column req_body on partation '20230901'

  

 

 

 

 

 

 

 

 

 

  

posted @ 2023-09-19 18:31  ☞@_@  阅读(52)  评论(0编辑  收藏  举报