Docker zabbix-agent 监控 docker tomcat 多实例

目录

监控方案概述

我们使用 zabbix-agent 的方式来监控 多个 tomcat 8.5.51 ,由于我们需要监控的是 Docker 容器里的 Tomcat ,而 zabbix 官方模板并不支持,而且官方提供的第三方方案也不支持多实例监控,所以只能参考很多互联网上的一些解决方案,最终形成了适合我们自己的应用场景的解决方案(监控虚拟机里的多个 tomcat 实例方案见文末的参考资料)。

本文详细描述了整个方案的详细过程和原理,如果只是想监控 tomcat 多个 Docker 实例,请参考:tomcat 监控实际操作

准备工作

  • 配置 tomcat 容器的 LABEL 标签:JMX_PORTJMX_MONITOR_UUID 用于定义使用的 jmx 端口和 tomcat 的 UUID 标记。
  • tomcat 配置 jmx,实际上 java 应用的 jmx 监控中原理都相同,开启并配置 jmx 的远程监控配置即可,这个是监控的前提条件。
  • tomcat 自动发现脚本
  • tomcat_jmx 监控数据源脚本
  • cmdline-jmxclient-0.10.3.jar 来监控数据
  • 处理 zabbix-server 获取不到 zabbix-agent 收集的数据问题
  • 处理 zabbix-agent 镜像挂载容器外的 docker 进程时候报错:permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock

tomcat 容器镜像启动

拉取 tomcat 镜像

docker pull develop-harbor.geostar.com.cn/base/apache-tomcat:8.5.51-8u231

启动 tomcat 多实例

docker run  -p 8088:8080 -p 10057:10057 --name tomcat-test1 -l JMX_MONITOR_UUID=bc47dcd484724fb48fe81bc9f0e3d802 -l JMX_PORT=10057 -d develop-harbor.geostar.com.cn/base/apache-tomcat:8.5.51-8u231
docker run  -p 8089:8080 -p 10058:10058 --name tomcat-test2 -l JMX_MONITOR_UUID=bc47dcd484724fb48fe81bc9f0e3d803 -l JMX_PORT=10058 -d develop-harbor.geostar.com.cn/base/apache-tomcat:8.5.51-8u231

注意:这里启动了 2 个 tomcat 容器实例,第一个容器内部 8080 映射到外部为 8088,jmx使用 10057 端口,第一个容器内部 8080 映射到外部为8089,jmx 使用 10058 端口。这里定义的我们约定的标签有 JMX_PORTJMX_MONITOR_UUID ,JMX_PORT 用于定义使用的 jmx 端口,JMX_MONITOR_UUID 用于定义 tomcat 实例的 UUID 标记,区分各个 tomcat实例。
定义这两个标签是为了后续使用 Docker 的 api 来获取 tomcat 的监控信息(jmx 的端口、容器内部 ip、)

进入每个tomcat容器实例内部(以tomcat-test1为例子)

docker exec -it tomcat-test1 bash

配置 jmx 监听

vi /srv/tomcat8/bin/catalina.sh

加入以下配置

CATALINA_OPTS="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=10057 -Dcom.sun.management.jmxremote.rmi.port=10057 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false -Djava.rmi.server.hostname=172.16.101.245"

其中-Djava.rmi.server.hostname=配置为当前服务器 ip,请自行修改,
-Dcom.sun.management.jmxremote.port=10057
-Dcom.sun.management.jmxremote.rmi.port=10057
这两个 jmx 的端口需要与容器启动时候用的 jmx 端口保持一致。

退出 tomcat 容器,重启 tomcat 容器

exit
docker restart tomcat-test1

测试 jmx 能否获取到数据,打开 jdk 目录下面的 jconsole 工具,输入 jmx 远程连接 ip 和 jmx 连接端口

点连接后正常连接就证明 jmx 已正常启用

在这个过程中我们发现一些主要的注意事项,请您在结合自己的监控场景的时候也一定注意:

带密码的 jmx 配置

我们在监控的时候因为会有很多个 tomcat 的 docker 实例,为了简化监控,所以使用 jmx 连接并没有设置密码,如果需要密码访问 jmx ,那么需要设置如下的:

CATALINA_OPTS="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=10057 -Dcom.sun.management.jmxremote.rmi.port=10057 -Dcom.sun.management.jmxremote.authenticate=true -Dcom.sun.management.jmxremote.ssl=false -Djava.rmi.server.hostname=172.16.101.245 
-Dcom.sun.management.jmxremote.access.file=/srv/tomcat8/conf/jmx.access
-Dcom.sun.management.jmxremote.password.file=/srv/tomcat8/conf/jmx.password"
  • authenticate:改为 true

  • access.file:设置访问权限,readonly:只能读取 MBean 的属性和接受通知。

    • readonly:只能读取 MBean 的属性和接受通知。
    • readwrite:还允许设置属性,调用方法,创建和删除 MBean。
    # cat /srv/tomcat8/conf/jmx.access  如果不存在这个文件请自行创建
    admin readwrite
    
  • password.file:访问密码

    # cat /srv/tomcat8/conf/jmx.password  如果不存在这个文件请自行创建
    admin tomcat
    

创建完成上述文件后,修改文件权限(这一步很关键,因为这些属于敏感信息,所以需要限制访问权限,不修改的话会在监控的时候报错)

# chmod 400 jmx.*

注意:这个时候需要重启 tomcat 容器让配置生效

端口的映射问题

采用 tomcat 的 jmx 监控有一个限制,容器对外映射 jmx 端口,容器内部 jmx 端口,配置文件里的 jmx 端口,三者必须严格保持一致,不然无法正常获取到监控数据,所以,必须是 -p 10057:10057 这种形式来启动 tomcat 容器,如果是 10058:10057这种形式会失败,或者在 dockerfile 里用 expose 10057,外部映射随机端口,同样会失败,这个坑一定要注意。虽然 oracle 的工程师通过别的解决方案解决了这个问题,但是会引入 oracle 的一些商业软件进来,规避了这个问题本身,所以不采取他们的方案:http://thegridman.com/coherence/oracle-coherence-on-docker/#jmx

ps ef | grep tomcat 过滤 tomcat jmx 端口方案

相对于用 docker api 的方式获取 tomcat 容器 jmx 端口的方案,还有另外一种方案,仅供参考。

jmx_tomcat_discovery.sh,执行下面这个脚本就可以获取 tomcat jmx 监控的端口号,如果是在 docker 版的 zabbix-agent 容器内执行,还需要在启动这个 agent 容器的时候加上 --pid=host 这个启动参数。

#!/bin/bash

# this is the server ip
serverip=127.0.0.1

# serverObj example:"{#SERVER_IP}": "172.16.101.181", "{#TOMCAT_NAME}": "tomcat_10053"
serverObj=""

# this cmd returns the jmx port the tomcat instances using
tomcat_jxm_ports_res=`ps -aux | grep "tomcat" | awk '{for(i=1;i<=NF;i++){print $i;}}' | grep jmxremote.port | cut -d'=' -f 2`

for tomcat_jmx_port in $tomcat_jxm_ports_res
do
   tmp=\{\"{#SERVER_IP}\":\"$serverip\",\"{#TOMCAT_NAME}\":\"tomcat_$tomcat_jmx_port\",\"{#TOMCAT_PORT}\":\"$tomcat_jmx_port\"\},
   serverObj="$serverObj$tmp"
done

# subString the last comma of the serverObj string
if [ $serverObj ] ; then
  serverObj=${serverObj:0:-1}
fi

# the jsonResult is like {"data": [{"{#SERVER_IP}": "172.16.101.181", "{#TOMCAT_NAME}": "tomcat_10053", "{#TOMCAT_PORT}": "10053"}, {"{#SERVER_IP}": "172.16.101.181", "{#TOMCAT_NAME}": "tomcat_10053", "{#TOMCAT_PORT}": "10054"}]}

if [ $serverObj ] ; then
  jsonResult=\{\"data\":[$serverObj]\}
  echo $jsonResult
else
  echo ""
fi

验证是否能获取 jmx 监控数据

除了用 jconsole 的本地方式连接测试外,更推荐一种在 zabbix-server上通过 cmdline-jmxclient 验证的方式,因为这样能确保服务端可以连接上客户端。

  1. 服务端下载 cmdline-jmxclient

    wget http://crawler.archive.org/cmdline-jmxclient/cmdline-jmxclient-0.10.3.jar
    
  2. 测试

    [root@host-172-16-102-253 ~]# java -jar cmdline-jmxclient-0.10.3.jar - 172.16.101.245:10057 java.lang:type=Memory NonHeapMemoryUsage
      05/04/2020 14:53:19 +0800 org.archive.jmx.Client NonHeapMemoryUsage:
      committed: 36372480
      init: 2555904
      max: -1
      used: 33912184
    

注意:如果是有用户名/密码的 jmx 监控,那么需要把 ip 前面的 - 替换为我们设置的 admin:tomcat

tomcat自动发现脚本

获取 tomcat 多个容器实例的 容器 ip、tomcat JMX 端口,uuid,输出为 json 格式提供给 zabbix-server 获取使用(没办法,只能自己写脚本咯,:)。

jmx_tomcat_discovery.py

#!/usr/bin/python
# -*- encoding: utf-8 -*-

import urllib
import xml.etree.ElementTree as ET
import json
import os
import commands
import subprocess

def main():
    
    data = []
    
    (status, docker_ps_output) = commands.getstatusoutput('docker ps -q')
    docker_ps_output_text = docker_ps_output.decode('utf-8')
    if docker_ps_output_text:
      container_id_list=docker_ps_output_text.split('\n')
      for container_id in container_id_list:
        out_bytes = subprocess.check_output(['docker','inspect',container_id])
        out_text = out_bytes.decode('utf-8')
        result=json.loads(out_text)
        jmx=result[0]['Config']['Labels']
        if('JMX_PORT' in jmx):
          jmx_port=result[0]['Config']['Labels']['JMX_PORT']
          jmx_monitor_uuid=result[0]['Config']['Labels']['JMX_MONITOR_UUID']
          ip=result[0]['NetworkSettings']['Networks']['bridge']['IPAddress']
          tomcat_instance={"{#CONTAINER_IP}":ip,"{#JMX_PORT}":jmx_port,"{#JMX_MONITOR_UUID}":jmx_monitor_uuid}
          data.append(tomcat_instance)
      print json.dumps({"data": data})
    else:
      print "empty result of docker ps -q"

if __name__ == "__main__":
    main()

这个脚本我们直接放到了自制的 zabbix-agent 容器镜像内,供我们的自定义 UserParameter 来调用。你也可以根据你的情况放到你认为合适的位置。

tomcat_jmx监控数据源脚本

监控模板参考zabbix监控自动发现监控tomcat(V1)修改而来,定义了我需要的 CONTAINER_IP,JMX_PORT,JMX_MONITOR_UUID 三个自定义占位符。

tomcat_monitor.sh,这个脚本跟上面的 python 脚本一样放到 zabbix-agent 的容器镜像里,供我们的自定义 UserParameter 来调用。这里我针对自己的环境和需要的东西做了优化,跟你环境不合适的位置请自行修改。

#!/bin/bash

source /etc/profile

[ $# -ne 3 ] && echo 'The scripts need 3 parameters' && exit 1

CONTAINER_IP=$1
JMX_PORT=$2
ITEM=$3

authenticate="-"
# if no authenticate,use "-",otherwise,add authenticate jmx user and password code here 
# jmx_user="akiya"
# jmx_password="akiya_password"
# if [ -n "$jmx_user" ] && [ -n "$jmx_password" ]; then
#        authenticate="$jmx_user:$jmx_password"
# fi

# The PORT means the tomcat service default port in the server.xml
PORT=8080

# The cmd means the  directory of cmdline-jmxclient jar 
cmd=/etc/zabbix/scripts/tomcat/cmdline-jmxclient-0.10.3.jar

#logdir=/tmp/zabbix_tmp
#[ ! -d "$logdir" ] && mkdir -p $logdir && chmod 644 $logdir
#cd $logdir

LOGDIR=/etc/zabbix/scripts/tomcat/logs


function HeapMemoryUsage() {
  java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Memory HeapMemoryUsage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function EdenSpaceUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=PS\ Eden\ Space Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function SurvivorSpaceUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=PS\ Survivor\ Space Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function TenuredGenUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=PS\ Old\ Gen Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function NonHeapMemoryUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Memory NonHeapMemoryUsage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function MetaspaceUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=Metaspace Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function CodeCacheUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=Code\ Cache Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function CompressedClassSpaceUsage() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=MemoryPool,name=Compressed\ Class\ Space Usage 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function TotalLoadedClassCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=ClassLoading TotalLoadedClassCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function LoadedClassCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=ClassLoading LoadedClassCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function UnloadedClassCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=ClassLoading UnloadedClassCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function TotalStartedThreadCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Threading TotalStartedThreadCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function ThreadCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Threading ThreadCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function PeakThreadCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Threading PeakThreadCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function maxThreads() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=ThreadPool maxThreads 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function currentThreadCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=ThreadPool currentThreadCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function currentThreadsBusy() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=ThreadPool currentThreadsBusy 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function GlobalRequestProcessor_bytesReceived() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=GlobalRequestProcessor bytesReceived 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function GlobalRequestProcessor_bytesSent() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=GlobalRequestProcessor bytesSent 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function requestCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=GlobalRequestProcessor requestCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function errorCount() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT Catalina:name=\"http-nio-$PORT\",type=GlobalRequestProcessor errorCount 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

function jvmUptime() {
        java -jar $cmd $authenticate $CONTAINER_IP:$JMX_PORT java.lang:type=Runtime Uptime 2>$LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
}

case $ITEM in

HeapMemoryUsage.max)
        HeapMemoryUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
HeapMemoryUsage.used)
        HeapMemoryUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
HeapMemoryUsage.committed)
        HeapMemoryUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

EdenSpaceUsage.max)
        EdenSpaceUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
EdenSpaceUsage.used)
        EdenSpaceUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
EdenSpaceUsage.committed)
        EdenSpaceUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

SurvivorSpaceUsage.max)
        SurvivorSpaceUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
SurvivorSpaceUsage.used)
        SurvivorSpaceUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
SurvivorSpaceUsage.committed)
        SurvivorSpaceUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

TenuredGenUsage.max)
        TenuredGenUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
TenuredGenUsage.used)
        TenuredGenUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
TenuredGenUsage.committed)
        TenuredGenUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

NonHeapMemoryUsage.used)
        NonHeapMemoryUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
NonHeapMemoryUsage.committed)
        NonHeapMemoryUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

MetaspaceUsage.used)
        MetaspaceUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
MetaspaceUsage.committed)
        MetaspaceUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

CodeCacheUsage.max)
        CodeCacheUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
CodeCacheUsage.used)
        CodeCacheUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
CodeCacheUsage.committed)
        CodeCacheUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

CompressedClassSpaceUsage.max)
        CompressedClassSpaceUsage
        sed -n '4p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
CompressedClassSpaceUsage.used)
        CompressedClassSpaceUsage
        sed -n '5p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;
CompressedClassSpaceUsage.committed)
        CompressedClassSpaceUsage
        sed -n '2p' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT | awk '{print $2}'
        ;;

ClassLoading.TotalLoadedClassCount)
        TotalLoadedClassCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
ClassLoading.LoadedClassCount)
        LoadedClassCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
ClassLoading.UnloadedClassCount)
        UnloadedClassCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;

Threading.TotalStartedThreadCount)
        TotalStartedThreadCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
ThreadCount)
        ThreadCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
PeakThreadCount)
        PeakThreadCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;

maxThreads)
        maxThreads
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
currentThreadCount)
        currentThreadCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
currentThreadsBusy)
        currentThreadsBusy
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;

bytesReceived)
        GlobalRequestProcessor_bytesReceived
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
bytesSent)
        GlobalRequestProcessor_bytesSent
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;

requestCount)
        requestCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;
errorCount)
        errorCount
        awk '{print $6}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT
        ;;

jvmUptime)
        jvmUptime
        [ $? -eq 0 ] && awk '{print $6/1000}' $LOGDIR/$CONTAINER_IP.$ITEM.$JMX_PORT || echo 0
        ;;
esac

我们的 userparameter_tomcat.conf 里配置如下:

UserParameter=tomcat.discovery,/usr/bin/python /etc/zabbix/scripts/tomcat/jmx_tomcat_discovery.py
UserParameter=tomcat.status[*],/bin/bash /etc/zabbix/scripts/tomcat/tomcat_monitor.sh $1 $2 $3

处理 zabbix-server 获取不到 zabbix-agent 收集的数据问题

在 zabbix_server 端上使用 zabbix_get 测试的时候,会出现权限错误无数据,这个时候应该修改 zabbix-agent 容器里这些脚本的所属用户。

chown -R zabbix:zabbix /etc/zabbix/scripts/tomcat
chmod 775 /etc/zabbix/scripts/tomcat/cmdline-jmxclient-0.10.3.jar /etc/zabbix/scripts/tomcat/jmx_tomcat_discovery.py /etc/zabbix/scripts/tomcat/tomcat_monitor.sh

zabbix-agent 镜像挂载容器外的 docker 进程时候报错

因为,我们的脚本里用到 docker ps 、 docker inspect 等命令,所以需要在 zabbix-agent 容器里挂载宿主的 docker 进程,即 -v /usr/bin/docker:/usr/bin/docker -v /var/run/docker.sock:/var/run/docker.sock 这个挂载参数,会出现这个错误:

permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock

这个时候需要修改权限解决,在容器启动的时候修改权限(这个已经预制到我的 zabbix-agent 镜像里了)

chmod 777 /var/run/docker.sock

测试

在 zabbix-server 可以用下面的命令来测试 jmx 的所有 Bean(只到 ip:port部分,不包括后面部分) 和 Bean 的值(包括具体的 Bean 名字和属性)

# java -jar cmdline-jmxclient-0.10.3.jar - 172.16.101.245:10057 
# java -jar cmdline-jmxclient-0.10.3.jar - 172.16.101.245:10057 java.lang:type=Memory NonHeapMemoryUsage

在 zabbix-server 的容器镜像内,可以使用下面的命令来获取用户自定义参数 UserParameter 对应的 key 的值执行后获取的结果,比如:下面的例子会执行 jmx_tomcat_discovery.py 脚本,获取返回值。

# zabbix_get -s 172.16.102.96 -k tomcat.discovery
UserParameter=tomcat.discovery,/usr/bin/python /etc/zabbix/scripts/tomcat/jmx_tomcat_discovery.py

tomcat 监控

zabbix 主机管理页面关联 Templates App Tomcat 模版即可获得多个 tomcat 的 docker 实例的监控数据

监控到的数据

监控原理

现在,是时候总结下 多个 docker 的 tomcat 实例监控的原理了。

  1. 开启 tomcat 容器镜像的 jmx 监控配置并配置对外映射端口

  2. 用我们的自定义用户脚本,执行 jmx_tomcat_discovery.py 获取到多个 tomcat 容器的端口号,ip 地址, uuid 等信息,供 zabbix-server 端的自动发现规则使用

  3. 我们用发现出来的 ip ,port ,uuid 填充我们监控模板中的键,这样就保证了监控的每一个 key 都不一致(这个限制由 zabbix 本身决定了,也是为什么很多方案做不到监控多实例的原因),通过这个 key 去请求我们的 tomcat_monitor.sh 脚本,获取到监控项的值。

主要参考资料

记一次zabbix_get远程执行取值为空问题

zabbix自动发现agent上多个tomcat并使用JMX监控

zabbix中添加java/tomcat监控(JMX)

zabbix监控自动发现监控tomcat(V1)

posted on 2020-05-04 17:31  西街二叔  阅读(1215)  评论(0编辑  收藏  举报

导航