会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
大数据学习与分享
博客园
首页
新随笔
联系
订阅
管理
随笔 - 70
文章 - 0
评论 - 6
阅读 -
93252
2021年1月25日
Hive常用性能优化方法实践全面总结
摘要: Apache Hive作为处理大数据量的大数据领域数据建设核心工具,数据量往往不是影响Hive执行效率的核心因素,数据倾斜、job数分配的不合理、磁盘或网络I/O过高、MapReduce配置的不合理等等才是影响Hive性能的关键
阅读全文
posted @ 2021-01-25 13:25 大数据学习与分享
阅读(1320)
评论(0)
推荐(0)
编辑
公告
昵称:
大数据学习与分享
园龄:
4年5个月
粉丝:
40
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
大数据
(48)
Spark
(28)
大数据计算引擎
(21)
Hadoop
(16)
分布式存储系统
(11)
Kafka
(10)
Hive
(10)
SparkSQL
(7)
Java
(7)
内存计算
(7)
更多
随笔分类
Canal(1)
Hadoop(8)
HBase(5)
HDFS(4)
Hive(9)
Java(6)
Kafka(6)
Linux(2)
MapReduce(1)
Redis(2)
Scala(6)
Spark(27)
Yarn(1)
大数据(12)
大数据问题处理分析(3)
面试(1)
数据分析(5)
推荐系统(3)
随笔档案
2022年4月(1)
2021年4月(2)
2021年3月(3)
2021年2月(6)
2021年1月(7)
2020年12月(16)
2020年11月(22)
2020年10月(13)
阅读排行榜
1. Kafka集群消息积压问题及处理策略(7952)
2. 九种常见的数据分析模型(7696)
3. 监听MySQL的binlog日志工具分析:Canal(6812)
4. Redis中的一致性哈希问题(5978)
5. 如何为Kafka集群确定合适的分区数以及分区数过多带来的弊端(4165)
评论排行榜
1. JVM内存管理和垃圾回收(2)
2. 监听MySQL的binlog日志工具分析:Canal(2)
3. 学好Spark/Kafka必须要掌握的Scala技术点(一)变量、表达式、循环、Option、方法和函数,数组、映射、元组、集合(1)
4. Java并发队列与容器(1)
推荐排行榜
1. Linux性能检测常用的10个基本命令(3)
2. Spark闭包 | driver & executor程序代码执行(2)
3. Redis中的一致性哈希问题(2)
4. Redis从入门到精通(2)
5. SparkSQL中产生笛卡尔积的几种典型场景以及处理策略(1)
最新评论
1. Re:学好Spark/Kafka必须要掌握的Scala技术点(一)变量、表达式、循环、Option、方法和函数,数组、映射、元组、集合
不错
--DavidZuo
2. Re:Java并发队列与容器
最常用的就是 ConcurrentHashMap 这个
--kzcming
3. Re:JVM内存管理和垃圾回收
@lukelmouse 单词打错了,谢谢指正,已修改...
--大数据学习与分享
4. Re:JVM内存管理和垃圾回收
文中的minor gc 那,有错
--lukelmouse
5. Re:监听MySQL的binlog日志工具分析:Canal
试用过,有些笨重,简单应用通过ORM的状态跟踪就好了
--剪刀手猪八戒戴劳力士
点击右上角即可分享