HDFS - 随笔分类 - XGogo

Hadoop集群datanode磁盘不均衡的解决方案【转】

摘要：一、引言： Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况，比如集群中添加新的数据节点，节点与节点之间磁盘大小不一样等等。当hdfs出现不平衡状况的时候，将引发很多问题，比如MR程序无法很好地利用本地计算的优势，机器之间无法达到更好的网络带宽使用率，机器磁盘无法利用等等。阅读全文

posted @ 2018-07-19 21:11 XGogo 阅读(904) 评论(0) 推荐(0)

关于CentOS 6下Hadoop占用系统态CPU高的处理办法【转】

摘要：一次不经意发现Hadoop的系统态CPU使用率很高，然后百度一下居然是个已知问题。 RHEL6优化了内存申请的效率，而且在某些场景下对KVM的性能有明显提升：http://www.Linux-kvm.org/wiki/images/9/9e/2010-forum-thp.pdf。而Hadoop是个阅读全文

posted @ 2017-04-18 15:16 XGogo 阅读(449) 评论(0) 推荐(0)

[翻译] Dremel made simple with Parquet

摘要：首先自己的 blog 好久没有写技术相关的东西了，今天又动笔了，好高兴！然后转载请注明出处。最后开始正题: 原文：Dremel made simple with Parquet | Twitter Engineering Blog Google 对于传说中3秒查询 1 PB 数据的 Dremel，有阅读全文

posted @ 2017-03-05 18:14 XGogo 阅读(220) 评论(0) 推荐(0)

部署hadoop2.7.2 集群基于zookeeper配置HDFS HA+Federation

摘要：转自：http://www.2cto.com/os/201605/510489.html hadoop1的核心组成是两部分，即HDFS和MapReduce。在hadoop2中变为HDFS和Yarn。新的HDFS中的NameNode不再是只有一个了，可以有多个（目前只支持2个）。每一个都有相同的职能。阅读全文

posted @ 2016-10-26 14:22 XGogo 阅读(370) 评论(0) 推荐(0)

第九章搭建Hadoop 2.2.0版本HDFS的HA配置

摘要：Hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。在hadoop1时代，只有一个NameNode。如果该NameNode数据丢失或者不能工作，那么整个集群就不能恢复了。这是hadoop1中的单点问题，也是hadoop1不可靠的表现。hadoop2就解决了这个问题。 had 阅读全文

posted @ 2016-10-26 14:19 XGogo 阅读(389) 评论(0) 推荐(0)

HDFS High Availability Using the Quorum Journal Manager

摘要：HDFS High Availability Using the Quorum Journal Manager Purpose Note: Using the Quorum Journal Manager or Conventional Shared Storage Background Archi 阅读全文

posted @ 2016-10-26 14:17 XGogo 阅读(450) 评论(0) 推荐(0)

Namenode HA原理详解（脑裂）

posted @ 2016-10-26 14:15 XGogo 阅读(962) 评论(0) 推荐(0)

java.io.IOException: No FileSystem for scheme: hdfs

摘要：转自：http://www.cnblogs.com/justinzhang/p/4983673.html 介绍了如何将Maven依赖的包一起打包进jar包。使用maven-assembly打成jar后，将这个jar提供给其他工程引用的时候，报出如下错误：但是，在没有打成jar包的工程中，是可以正常阅读全文

posted @ 2016-10-13 17:04 XGogo 阅读(929) 评论(0) 推荐(0)

尧字节

明翼

随笔分类 - HDFS

公告