摘要: 1)安装、部署过程要尽可能自动化。将集群搭建的步骤脚本化,可以做到批量部署多个节点、快速上线/下线一个节点。集群的节点多,或者不断有节点上下线的话,都能省出不少的时间。2)搭建并充分利用好集群的监控系统。首先,最重要的是集群自带的监控系统。例如,HBase的Master、Region Server监控页面;Hadoop的JobTracker/TaskTracker、NameNode/DataNode监控页面;Storm的Storm UI监控页面,等等。这类监控侧重集群上的作业、资源等,而且包含的信息很全,包括作业运行的异常日志等,这对于排查、定位问题是非常及时有效的。其次,既然是集群,就需要有 阅读全文
posted @ 2014-02-22 17:01 熊健 阅读(505) 评论(0) 推荐(0) 编辑