随笔分类 - 监控zabbix-Prometheus
摘要:这里我们为Dashboard创建了一个名为node的变量,并且指定其类型为Query。Query类型的变量,允许用户指定数据源以及查询表达式,并通过正则匹配(Regex)的方式对查询结果进行处理,从而动态生成变量的可选值 函数 作用 label_values(label) 返回Promthues所
阅读全文
摘要:1. counter Counter 数据类型描述: 该数据类型在测控中是使用最频繁的数据类型,其用于记录事件的数量或者大小,并通常用来跟踪某个特定代码路径被执行频率和记录数、服务的字节数以及。 2. Gauge 数据类型 描述: 它存放的是一些当前状态的快照其值是可以动态改变的因此可以将负数传给该
阅读全文
摘要:1. 主从复制运行指标: 1、主从复制线程监控: Slave_IO_Running、Slave_SQL_Running两个线程正常那么说明我们的复制集群是健康状态的。 2、主从复制落后时间: MySQL的复制环境中,slave先从master上将binlog拉取到本地(通过IO thread),然后
阅读全文
摘要:1. cat /usr/local/grafana/conf/defaults.ini # The full public facing url #root_url = %(protocol)s://%(domain)s:%(http_port)s/ root_url = http://localh
阅读全文
摘要:1. telegraf的redis配置 [root@influxdb137 ~]# cat /etc/telegraf/telegraf.conf [global_tags] [agent] interval = "10s" round_interval = true metric_batch_si
阅读全文
摘要:1. 好的参考文档:prometheus/blackbox_exporter https://github.com/prometheus/blackbox_exporter https://github.com/prometheus/blackbox_exporter/blob/master/CON
阅读全文
摘要:1. Web Analytics Dashboard for NGINX Required NGINX json log format configuration below. https://grafana.com/grafana/dashboards/12559 log_format json_
阅读全文
摘要:1. 部署蓝鲸https://www.cnblogs.com/you-men/p/13416827.htmlv 2. 安装django mkdir ~/.virtualenvs python3 -m venv ~/.virtualenvs/djangodev python -m venv ~/.vi
阅读全文
摘要:1.服务返回异常5次就重启 #!/bin/bash restart=0 time=0 while true do for i in `cat /opt/check_status/monitor_url.txt` do echo $i sleep 30 timeout 10 ssh appuser@1
阅读全文
摘要:1.sh /home/jenkins_scripts/sendmessg.sh 生产 公众号 ${DEPLOY_FILE} 开始发布 2.脚本 sh /home/jenkins_scripts/sendmessg.sh 生产 公众号 ${DEPLOY_FILE} 开始发布 #!/bin/sh use
阅读全文
摘要:1.#思路:status可以看到dead 0说明集群健康;list列出重要表名也说明集群健康。 #在hbase服务器上加crontab 1 */2 * * * /bin/bash /tmp/hbase_status.sh > /tmp/status_hbase.txt1 */10 * * * /bi
阅读全文
摘要:1.timelion .es(q='status:200',index=filebeat-testindex*,timefield=@timestamp,metric=count).label('200'),.es(q='status:502',index=filebeat-testindex*,t
阅读全文
摘要:1.拨测服务端口 [root@VM_0_111_centos shell]# cat check_http_code1.sh #!/bin/bash while true do cat input1.txt| while read line do return_Code=`$line ;echo $
阅读全文
摘要:1.显示请求使用时间-使用gauge显示每次的请求时间 [root@VM_0_111_centos exporters]# cat request_time.py |egrep -v '^#|^$' import prometheus_client from prometheus_client im
阅读全文
摘要:1.编写exporter import prometheus_client from prometheus_client import Gauge,start_http_server,Counter import pycurl import time import threading from io
阅读全文
摘要:0.pushgateway的安装和配置 tar -zxf pushgateway-1.2.0.linux-amd64.tar.gz ./pushgateway & 在Prometheus添加配置 - job_name: 'node_111' static_configs: - targets: ['
阅读全文
摘要:0.数据抓取的生命周期 1.通过文件发现 - job_name: node file_sd_configs: - targets/nodes/*.json reflesh_interval: 5m 2.添加标签 cat ./node/node.json[{"targets":["10.0.0.111
阅读全文
摘要:1.每10分钟执行一次 */10 * * * * /opt/shell/check_disk.sh 2.脚本内容 for i in `cat /opt/shell/hosts` do # echo $i sys=`ssh $i "df -h |grep '\/$'"` #echo $sys sysc
阅读全文
摘要:1.绑定企业微信,扫码系统出现异常 看日志:/data/bkce/logs/open_paas/esb.log https://qyapi.weixin.qq.com/cgi-bin/解析有问题。
阅读全文
摘要:0.若是gse成功了,cmdb步骤其实就结束了 ./bkcec install gse 1./bkcec initdata gse./bkcec start gse./bkcec status gse ./bkcec status gse dig gse.service.consul 1./bkce
阅读全文