Hive之优化

Hive之优化

第一节:简介

hive的优化 --- mapreduce的优化

1个reducetask对应的数据量最好不超过2G

reducetask的个数最好不超过0.95*datanode的个数

第二节:优化手段

一、合理选择排序

二、合理做笛卡尔积

 

三、in/exists效率低

hive 高效实现手段

inner join

left semi join

四、insert选择

能使用多重插入,就不使用单重插入。

五、合理分桶

1、join 性能

合理的分桶会提升join的性能

posted @   整合侠  阅读(145)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
历史上的今天:
2018-07-21 CSS Ul(列表样式)
2018-07-21 CSS Link(链接)
2018-07-21 CSS Fonts(字体)
2018-07-21 CSS Text(文本)
点击右上角即可分享
微信分享提示