2021 年 1月 25 日随笔档案 - 大数据学习与分享 - 博客园

2021年1月25日

Hive常用性能优化方法实践全面总结

摘要： Apache Hive作为处理大数据量的大数据领域数据建设核心工具，数据量往往不是影响Hive执行效率的核心因素，数据倾斜、job数分配的不合理、磁盘或网络I/O过高、MapReduce配置的不合理等等才是影响Hive性能的关键阅读全文

posted @ 2021-01-25 13:25 大数据学习与分享阅读(1320) 评论(0) 推荐(0) 编辑

公告

昵称：大数据学习与分享
园龄： 4年5个月
粉丝： 40
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:学好Spark/Kafka必须要掌握的Scala技术点（一）变量、表达式、循环、Option、方法和函数，数组、映射、元组、集合
不错
--DavidZuo
2. Re:Java并发队列与容器
最常用的就是 ConcurrentHashMap 这个
--kzcming
3. Re:JVM内存管理和垃圾回收
@lukelmouse 单词打错了，谢谢指正，已修改...
--大数据学习与分享
4. Re:JVM内存管理和垃圾回收
文中的minor gc 那，有错
--lukelmouse
5. Re:监听MySQL的binlog日志工具分析：Canal
试用过，有些笨重，简单应用通过ORM的状态跟踪就好了
--剪刀手猪八戒戴劳力士