蓝鲸监控hbase集群状态
1.#思路:status可以看到dead 0说明集群健康;list列出重要表名也说明集群健康。
#在hbase服务器上加crontab
1 */2 * * * /bin/bash /tmp/hbase_status.sh > /tmp/status_hbase.txt
1 */10 * * * /bin/bash /tmp/hbase_table.sh > /tmp/table_hbase.txt
cat /tmp/hbase_status.sh
#!/bin/bash
/usr/bin/hbase shell <<EOF
status
EOF
cat /tmp/hbase_table.sh
#!/bin/bash
/usr/bin/hbase shell <<EOF
list
EOF
2.#在蓝鲸web页面添加自定义监控
#!/bin/bash
#在蓝鲸web页面添加自定义监控
status=`egrep -c 'dead 0' /tmp/status.txt`
table=`egrep -c '替换成重要表名' /tmp/hbase.txt`
hbase_status=1
if [ $table -ne 2 $b ] && [ $status -ne 1 ] ;then
hbase_status=0
fi
echo "hbase_health{hostname_name=\"10.51.86.13(hbase-ip)\"} ${hbase_status}"
用一个例子来演示会更加清晰