代码改变世界

ClickHouse内存配置参数

2023-10-09 09:41  abce  阅读(4708)  评论(0编辑  收藏  举报

1.max_memory_usage
运行单个查询时使用的最大内存量。
默认设置为无限(设置为 0)。
该设置不考虑可用内存容量或机器上的内存总量。该限制适用于单个服务器中的单个查询。你可以使用SHOW PROCESSLIST查看每个查询的当前内存消耗。此外,每次查询的内存消耗峰值都会被跟踪并写入日志。
某些聚合函数的状态不会受到内存使用情况的监控。
对于来自字符串和数组参数的聚合函数min、max、any、anyLast、argMin、argMax的状态,不完全跟踪他们对内存的使用情况。
内存消耗还受到 max_memory_usage_for_user 和 max_server_memory_usage 参数的限制。

 

2.max_memory_usage_for_user
在单个服务器上运行用户查询时使用的最大内存容量。
默认值在Settings.h中定义。默认情况下,该值不受限制(max_memory_usage_for_user = 0)。

 

3.max_server_memory_usage
内存使用总量限制。零表示无限制。
默认的 max_server_memory_usage 值计算公式为:memory_amount * max_server_memory_usage_to_ram_ratio。

 

4.max_server_memory_usage_to_ram_ratio
与 max_server_memory_usage 相同,但与物理内存成比例。允许降低低内存系统的内存使用率。零表示无限制。
在内存和交换容量较小的主机上,可能需要将 max_server_memory_usage_to_ram_ratio 设置得大于 1。0 表示可以使用所有可用内存。
默认配置:

<max_server_memory_usage_to_ram_ratio>0.9</max_server_memory_usage_to_ram_ratio>

 

5.max_memory_usage_for_all_queries
默认值是0,即不限制对内存的使用。


内存配置的官方建议

https://clickhouse.com/docs/en/operations/tips

对于少量数据(压缩后不超过 ~200 GB),最好使用与数据量相同的内存。对于大数据量和处理交互式(在线)查询时,应使用合理的内存容量(128 GB 或更多),这样热数据子集才能放入页面缓存。即使每台服务器的数据量为 ~50 TB,使用 128 GB 内存也比使用 64 GB 内存能显著提高查询性能。

不要禁用overcommit。

$ cat /proc/sys/vm/overcommit_memory 的值应为0或1

运行

$ echo 0 | sudo tee /proc/sys/vm/overcommit_memory

如果系统内存不足 16GB,可能会出现各种内存异常,因为默认设置与内存容量不匹配。建议内存容量为 32GB 或更大。