2013 年 5月 27 日随笔档案 - 季石磊

2013年5月27日

摘要：线上部署hadoop、hbase 一般都是采用存储、计算一对一的方式，即每个节点启动 hadoop 的 datanode（以下简称dn）& tasktracker（以下简称tt）再加 hbase regionserver（以下简称rs），hadoop namenode（以下简称nn）和 hbase master（以下简称master）一般在负载较轻的情况下可以部署在同一个节点上。生产集群在长时间运行过程中不可避免存在机器损坏替换的情况，计算资源需求随着业务数据量的增长也会不断提高，这需要我们对集群进行扩容或缩减。集群改变规模后，最为彻底的刷新方式就是重启整个集群，但重启会导致服务阅读全文

posted @ 2013-05-27 10:58 季石磊阅读(1643) 评论(0) 推荐(0) 编辑

Hbase性能优化

摘要：以下为使用hbase一段时间的几个思考，由于在内存充足的情况下hbase能提供比较满意的读性能，因此写性能是思考的重点。希望读者提出不同意见讨论1 autoflush=false 无论是官方还是很多blog都提倡为了提高hbase的写入速度而在应用代码中设置autoflush=false，然后在在线应用中应该谨慎进行该设置。原因如下： a autoflush=false的原理是当客户端提交delete或put请求时，将该请求在客户端缓存，直到数据超过2M(hbase.client.write.buffer决定)或用户执行了hbase.flushcommits()时才向regionserver. 阅读全文

posted @ 2013-05-27 09:51 季石磊阅读(1139) 评论(0) 推荐(0) 编辑

公告