clickhouse sql优化笔记

1.order by sort_field  limit 1 by group_f1, group_f2

sql目的:根据group_f1,group_f2去重并按照sort_field排序保留第一个

当数据量很大时,order by 操作非常慢而且占用内存很大,容易导致oom

优化方案:可以先分组,组内找到排序字段最小值,然后筛选

select *
from t
where (group_f1,group_f2, sort_field) in (
    select account_id, seller_sku, min(sort_field) min_sort_field
    from t
    group by group_f1,group_f2
)

 

posted @   foreast  阅读(60)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示