04 2016 档案

摘要:1.用于打开运行中的jvm进程的gc 监控日志以及查看相关参数设置:jinfo 2.其它工具如:jps、jstack、jstat、jmap 阅读全文
posted @ 2016-04-29 13:52 梅里之巅 阅读(171) 评论(0) 推荐(0) 编辑
摘要:起因: hive premanent udf 发布成功,但是hue 无法加载使用(但是cli 是可用的) ,处理半天,依然不可用!后来发现重启hiveserver2 就可以了 具体步骤如下: a. 将jar 放到hdfs上 hdfs:///tmp/hive-udf-1.0-SNAPSHOT.jar 阅读全文
posted @ 2016-04-27 10:08 梅里之巅 阅读(378) 评论(0) 推荐(0) 编辑
摘要:1.首先官方下载源码,然后安装(./configure,make all,make install,make clean,make distclean) 注意:需要先安装zlib-devel,openssl-devel,这个在之后安装pip时需要,否则之后需要重新编译安装python2.7.11 另 阅读全文
posted @ 2016-04-24 20:12 梅里之巅 阅读(554) 评论(0) 推荐(0) 编辑
摘要:小文件导致任务执行缓慢的原因: 1.很容易想到的是map task 任务启动太多,而每个文件的实际输入量很小,所以导致了任务缓慢 这个可以通过 CombineTextInputFormat,解决,主要需要设置 mapreduce.input.fileinputformat.split.maxsize 阅读全文
posted @ 2016-04-18 11:07 梅里之巅 阅读(554) 评论(0) 推荐(0) 编辑
摘要:Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。 核心功能: 快速创建数据可视化互动仪表盘 丰富的可视化图表模板,灵活可扩展 细粒度高可扩展性的安全访问模型 阅读全文
posted @ 2016-04-14 23:58 梅里之巅 阅读(2255) 评论(0) 推荐(0) 编辑
摘要:最近CDH集群频繁告警,原因是某些host频繁swapping,极大影响了集群的性能。 后来发现有个设置(/proc/sys/vm/swappiness)需要修改,默认值60 Setting the vm.swappiness Linux Kernel Parameter vm.swappiness 阅读全文
posted @ 2016-04-11 19:21 梅里之巅 阅读(1303) 评论(1) 推荐(0) 编辑
摘要:之前只他调整过dfs 的存储目录到最大配额的目录,其它没有处理(就是在默认的/ 目录下,而这个目录的存储配额只有50G) 运行一周的时间不到,集群开始告警,查看是目录/ 的存储占用超过了60% 再查看具体目录情况,主要占用的目录有四个,分别是: /yarn 11G /var 9.6G /opt 4. 阅读全文
posted @ 2016-04-05 10:22 梅里之巅 阅读(353) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示