m-zhuang

导航

Zabbix 分布式监控平台

一、Zabbix 概述

作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果,和网站的健康状态。

利用一个优秀的监控软件,我们可以:

  • 通过一个友好的界面进行浏览整个网站所有的服务器状态
  • 可以在Web 前端方便的查看监控数据
  • 可以回溯寻找事故发生时系统的问题和报警情况

1. Zabbix 是什么

  • Zabbix是一个基于Web界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

  • Zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。

  • Zabbix 由2部分构成,Zabbix server 与可选组件Zabbix agent。 通过C/S模式采集数据,通过B/S模式在web端展示和配置。

  • Zabbix server 可以通过SNMP(简单网络管理协议),Zabbix agent,ping, 端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它 可以运行在Linux等平台上。(支持多个平台,windows也支持)

  • Zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。

2. Zabbix 监控原理

Zabbix agent安装在被监控的主机上,Zabbix agent 负责定期收集客户端本地各项数据,并发送至Zabbix server 端,Zabbix server收到数据后,将数据存储到数据库中,用户基于Zabbix WEB可以看到数据在前端展现图像。

当Zabbix 监控某个具体的项目,该项目会设置一个触发器阈值,当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(shell 命令、reboot、 restart、 install 等)。

用户可以基于Zabbix-web可以在WEBUI界面中查看展现的数据图像,以及进行相关的配置管理用户还可以在WEBUI界面中设置监控项的触发器,如被监控的数据指标超过触发器设定的阈值,会进行发送通知信息或者一些应急操作指令。

3. Zabbix 监控对象

系统监控、网络设备监控、java 监控、硬件监控、应用服务监控、mysql数据库监控、URL监控

4. Zabbix 常见的五个程序

Zabbix监控部署在系统中,包含常见的五个程序:

Zabbix_server、Zabbix_agent、 Zabbix_proxy、Zabbix_get、Zabbix_sender

(1)Zabbix server

Zabbix服务端守护进程,其中 Zabbix agent、Zabbix get、Zabbix_sender、Zabbix proxy钓数据最终都提交给Zabbix server

Zabbix server 默认端口号:10051

(2)Zabbix agent

客户端守护进程,负责收集客户端数据,例如:收集 CPU_负载、内存、硬盘使用情况等

Zabbix agent 默认端口号:10050

(3)Zabbix proxy

Zabbix分布式代理守护进程,通常大于500台主机,需要进行分布式监控架构部署

(4)Zabbix get

Zabbix数据接收工具,单独使用的命令,通常在 server 或者 proxy 端执行获取远程客户端信息的命令

(5)Zabbix sender

Zabbix数据发送工具,用户发送数据给 server或 proxy端,通常用户耗时比较长的检查

5. Zabbix 工作原理

采用了两种模式

主动模式:agent 向server发起连接

被动模式:server向agent发起连接

在Zabbix中,主动模式和被动模式是指Zabbix Agent与Zabbix Server之间的通信方式,与客户端和服务端之间的通信无关。

在Zabbix中,主动模式是指Zabbix Agent主动向Zabbix Server发送数据,而被动模式是指Zabbix Server主动连接Zabbix Agent来获取数据。

在主动模式下,Zabbix Agent会在预定的时间间隔内主动向Zabbix Server发送数据。Zabbix Server会接收到这些数据,进行处理和存储。

而在被动模式下,Zabbix Server会主动连接Zabbix Agent,获取监控数据。Zabbix Agent会在指定的端口上等待Zabbix Server的连接,并将收到的请求数据发送给Zabbix Server。

具体的流程如下:

主动模式:

  1. Zabbix Agent定期向Zabbix Server发送数据请求。
  2. Zabbix Server接收到请求后,查询需要获取的监控项数据,并将数据发送给Zabbix Agent。
  3. Zabbix Agent将收到的数据发送给Zabbix Server。

被动模式:

  1. Zabbix Server主动连接Zabbix Agent的指定端口。
  2. Zabbix Agent在指定端口上等待Zabbix Server的连接。
  3. Zabbix Server发送数据请求到Zabbix Agent。
  4. Zabbix Agent将收到的请求数据发送给Zabbix Server。

这两种模式的选择取决于具体的监控需求和网络环境。主动模式适用于需要实时监控的场景,而被动模式适用于需要减少服务器负载的场景。

二、部署 Zabbix

1. 环境

节点 主机IP 服务 硬件
zabbix-server 192.168.23.45 zabbix-server-mysql
zabbix-agent
2C 4G(至少)
zabbix-agent 192.168.23.50 zabbix-agent2

关闭防火墙及更改主机名

主机192.168.23.45

systemctl stop firewalld
setenforce 0

hostnamectl set-hostname zabbix-server
su

主机192.168.23.50

systemctl stop firewalld
setenforce 0

hostnamectl set-hostname zabbix-agent
su

2. 部署 Zabbix 服务端

建议使用Zabbix 5.0/4.6/4.8版本,关闭防火墙及SeLinux安全机制

(1)安装 Zabbix 源

# 获取 zabbix 的下载源
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm 

# 更换 zabbix.repo 为阿里云
sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo

# 清除yum缓存及创建缓存元数据
yum clean all && yum makecache

(2)安装 Zabbix服务端及mysql、客户端

yum -y install zabbix-server-mysql zabbix-agent

安装SCL(Software Collections),便于后续安装高版本的 php,默认 yum 安装的 php 版本为 5.4,版本过低,zabbix 5.0 版本对 php 版本最低要 7.2.0 版本。SCL 可以使得在同一台机器上使用多个版本的软件,而又不会影响整个系统的依赖环境。软件包会安装在 /opt/rh 目录下。

yum -y install centos-release-scl

(3)修改 zabbix-front 前端源,安装 zabbix 前端环境到 scl 环境下

# 开启安装源
sed -i 's/enabled=0/enabled=1/' /etc/yum.repos.d/zabbix.repo

yum install -y zabbix-web-mysql-scl zabbix-apache-conf-scl

(4)安装 zbbix 所需的数据库

yum -y install mariadb-server mariadb
systemctl enable --now mariadb

# 初始化数据数据库,并设置密码,如 123123
mysql_secure_installation

(5)添加数据库用户以及 zabbix 所需的数据库信息

# 登录数据库
mysql -u root -p123123

# 创建zabbix数据库并设置编码为utf-8
create database zabbix character set utf8 collate utf8_bin;

# 给用户赋权 
grant all on zabbix.* to 'zabbix'@'%' identified by 'zabbix';

# 刷新
flush privileges;

# 退出数据库界面
\q

(6)导入数据库信息

# 查询sql文件的位置
rpm -ql zabbix-server-mysql

# 导入数据库信息
zcat /usr/share/doc/zabbix-server-mysql-5.0.36/create.sql.gz | mysql -u root -p123123 zabbix

(7)修改 zabbix server 配置文件,修改数据库密码

vim /etc/zabbix/zabbix_server.conf
# 124行,指定zabbix数据库密码
DBPassword=zabbix

(8)修改 zabbix 的 php 配置文件

vim /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf
# 25行,取消注释,修改时区
php_value[date.timezone] = Asia/Shanghai

(9)启动 zabbix 相关服务

systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm
systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm

(10)浏览器检验

浏览器访问:http://192.168.23.45/zabbix

点击下一步,设置数据库的密码 zabbix

安装完成后,默认的登录账号和密码为:Admin/zabbix

设置文件界面:点击左边菜单栏的【User settings】,【Language】选择 Chinese(zh_CN),再点击 Update 更新。

image-20230808164854488

image-20230808164920631

image-20230808164955976

image-20230808165017355

image-20230808165113114

image-20230808165207262

image-20230808165228403

image-20230808165430116

image-20230808165457274

image-20230808165520064

(11)解决zabbix web页面中文出现乱码

image-20230808170154332

安装文泉驿微米黑字体(wqy-microhei-fonts),然后将该字体文件复制到DejaVuSans.ttf文件

yum -y install wqy-microhei-fonts

cp -f /usr/share/fonts/wqy-microhei/wqy-microhei.ttc /usr/share/fonts/dejavu/DejaVuSans.ttf

image-20230808171049283

3. 部署 Zabbix 客户端

zabbix 5.0 版本采用 golang 语言开发的新版本客户端 agent2

zabbix 服务端 zabbix_server 默认使用 10051 端口,客户端 zabbix_agent2 默认使用 10050 端口

(1)服务器和客户端都配置时间同步

# zabbix-server和zabbix-agent节点
yum -y install ntpdate
ntpdate -u ntp.aliyun.com

(2)客户端配置时区,与服务器保持一致

mv /etc/localtime{,.bak}
ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

date

(3)设置 zabbix 的下载源,安装 zabbix-agent2

rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm 

sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo

yum -y install zabbix-agent2

(4)修改 agent2 配置文件

vim /etc/zabbix/zabbix_agent2.conf
Server=192.168.23.45			# 80行,指定 zabbix 服务端的 IP 地址
ServerActive=192.168.23.45		# 125行,指定 zabbix 服务端的 IP 地址
Hostname=zabbix-agent			# 131行,指定当前 zabbix 客户端的主机名

(5)启动 zabbix-agent2

systemctl start zabbix-agent2
systemctl enable zabbix-agent2

(6)在服务端验证 zabbix-agent2 的连通性

# 安装 zabbix 主动获取数据的命令
yum -y install zabbix-get

zabbix_get -s '192.168.23.50' -p 10050 -k 'agent.ping'

zabbix_get -s '192.168.23.50' -p 10050 -k 'system.hosthome'

image-20230808183521329

(7)在 Web 页面中添加 agent 主机

点击左边菜单栏【配置】中的【主机】,点击【创建主机】

【主机名称】设置成 zabbix-agent

【可见的名称】设置成 zabbix-agent-192.168.23.50

【群组】选择 Linux servers

【Interfaces】的【IP地址】设置成 192.168.23.50

再点击上方菜单栏【模板】

【Link new tamplates】搜索 Linux ,选择 Template OS Linux by Zabbix agent

点击 【添加】

image-20230809140201509

image-20230809140619727

image-20230809140712258

image-20230809140758346

image-20230809141017916

三、案例 自定义监控内容

案例:自定义监控客户端服务器登录人数

需求:限制登陆人数不超过3个,超过3个就发出警报信息

1. 在客户端创建自定义 key

who
who | wc -l

image-20230809142546763

创建 zabbix 的监控项配置文件,用于自定义 key

vim /etc/zabbix/zabbix_agent2.conf

可以将自定义的监控项配置文件创建在 zabbix_agent2.d 目录中

268 Include=/etc/zabbix/zabbix_agent2.d/*.conf

自定义监控项的格式如下

291 # Format: UserParameter=\<key>,\<shell command>

cd /etc/zabbix/zabbix_agent2.d/
vim UserLogin.conf

UserParameter=login.user,who | wc -l

systemctl restart zabbix-agent2

image-20230809143126788

2. 在服务端验证新建的监控项

zabbix_get -s '192.168.23.50' -p 10050 -k 'login.user'

image-20230809150129541

3. 在 Web 页面创建自定义监控项模板

点击左边菜单栏【配置】中的【模板】,点击【创建模板】

【模板名称】设置成 Template Login User

【可见的名称】设置成 Template Login User

【群组】选择 Template

【描述】可自定义

点击 【添加】,此时就可在【链接的模板】中搜索到 Template Login User 了

image-20230809150445268

image-20230809150619990

image-20230809151122742

4. 创建应用集

点击上方菜单栏【应用集】,点击【创建应用集】

【名称】设置成 Login User

点击 【添加】

image-20230809151423980

image-20230809151502047

image-20230809151545678

image-20230809151628069

5. 创建监控项

点击上方菜单栏【监控项】,点击【创建监控项】

【名称】设置成 Number of login users

【键值】设置成 login.user #键值必须要与自定义的监控项配置文件中设置的保持一致

【更新间隔】设置成 10s

【历史数据保留时长】Storage period 30d #保留时间可自定义设置

点击 【添加】

image-20230809151845989

image-20230809151953328

image-20230809152313063

image-20230809152350708

image-20230809152528845

6. 创建触发器

(当监控项获取到监控的值后和触发器预设的值进行对比,判断是否报警)

点击上方菜单栏【触发器】,点击【创建触发器】

【名称】设置成 Number of login users is greater than 3

【严重性】设置成 一般严重

【表达式】点击添加,【监控项】点击选择 Number of login users,【功能】选择 last(),【结果】选择 > 3,点击 【插入】

点击 【添加】

image-20230809152759406

image-20230809152948832

image-20230809153530394

image-20230809153616289

7. 创建图形

点击上方菜单栏【图形】,点击【创建图形】

【名称】设置成 Number of login users

【宽】、【高】可直接采用默认值

【监控项】点击添加勾选相关监控项 Number of login users,【功能】选择 最大,其它可保持默认值

点击 【添加】

image-20230809153846651

image-20230809154438754

image-20230809154526557

image-20230809154601469

8. 将主机与模板关联起来

(一个主机可以关联多个模板)

点击左边菜单栏【配置】中的【主机】,点击你要关联的主机

点击上方菜单栏【模板】,【Link new tamplates】搜索 login,选择 Template Login User,点击【更新】

此时就点击【监测】中的【主机】,点击你关联主机的【图形】,即可查看到相关的监控项指标

image-20230809154925496

image-20230809155015301

image-20230809155111934

image-20230809155340849

9. 设置邮件报警

点击左边菜单栏【管理】中的【报警媒介类型】,点击【创建媒体类型】

【名称】设置成 qq_Email

【SMTP服务器】设置成 smtp.qq.com

【SMTP服务器端口】设置成 25

【SMTP HELO】设置成 qq.com

【SMTP电邮】设置成 自己的邮箱地址,例如 m_zhuang.69@qq.com

【认证】选择 用户名和密码

【用户名称】设置成 自己的邮箱地址,例如 m_zhuang.69@qq.com

【密码】可登录QQ邮箱页面,点击【设置】-->【账户】中的【生成授权码】,通过短信获取授权码

【描述】可自定义

点击上方菜单栏【Message templates】,点击【添加】,【Message type】选择 问题,点击【更新】

点击 【添加】,并测试功能

点击左边菜单栏【User settings】-->【报警媒介】,点击【添加】

【类型】选择 qq_Email

【收件人】设置成 m_zhuang.69@qq.com

【当启用时】设置成 1-7,00:00-24:00

点击 【添加】

再点击 【更新】

点击左边菜单栏【配置】中的【动作】,选择相对应的动作名称,点击【启用】

image-20230809155851793

image-20230809160805544

image-20230809160920645

image-20230809160948846

image-20230809161044875

image-20230809161151933

image-20230809161240148

image-20230809162501479

image-20230809162939401

image-20230809163012152

image-20230809164412686

10. 测试邮件报警

增加测试客户端的用户登录数超过触发器预设的值,查看【监测】-->【仪表盘】,确认报警

image-20230809164542581

image-20230809164622008

四、zabbix 自动发现于自动注册

(一)zabbix 自动发现

zabbix server 主动的去发现所有的客户端,然后将客户端的信息登记在服务端上。

缺点是如果定义的网段中的主机数量多,zabbix server 登记耗时较久,且压力会较大。

1. 确保客户端上的 zabbix-agent 服务状态正常

systemctl is-active zabbix-agent2.service 
active

2. 在 Web 页面删除原有的客户端主机

点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除

image-20230809181415698

image-20230809181442905

3. 在服务端和客户端上配置 hosts 解析

vim /etc/hosts
192.168.23.45 zabbix-server
192.168.23.50 zabbix-agent

4. 修改 zabbix

4. 在 Web 页面配置自动发现

点击左边菜单栏【配置】中的【自动发现】,点击【创建发现规则】

【名称】设置成 mynetwork

【IP范围】设置成 192.168.23.1-254

【更新间隔】设置成 30s

【检查】点击【添加】,【检查类型】选择 Zabbix 客户端,【端口范围】设置成 10050,【键值】设置成 system.uname

【设备唯一性准则】选择 IP地址

【主机名称】选择 DNS名称

【可见的名称】选择 主机名称

勾选 【已启用】,点击 【更新】

点击左边菜单栏【配置】中的【动作】,上方菜单选择 【Discovery actions】

勾选 【Auto discovery. Linux servers.】,点击 【启用】

点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机

可在服务端查看 zabbix 日志

tail -f /var/log/zabbix/zabbix_server.log

image-20230809182340029

image-20230809182634606

image-20230809183037154

image-20230809185350729

image-20230809185440225

image-20230809185506657

image-20230809191030546

可在服务端查看 zabbix 日志

tail -f /var/log/zabbix/zabbix_server.log

image-20230809191310824

(二)zabbix 自动注册

(对于 agent2 是主动模式)

zabbix agent2 会主动上报自己的信息,发给 zabbix server。

缺点是可能因为配置文件配置错误或者网络不通等原因导致 zabbix agent2 可能找不到 zabbix server。

1. 环境准备

点击左边菜单栏【配置】中的【自动发现】,勾选发现规则,点击 禁用

点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除

自定义脚本监控 https://kaikai136.blog.csdn.net/article/details/111309497?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2~default~CTRLIST~Rate-1-111309497-blog-123223449.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2~default~CTRLIST~Rate-1-111309497-blog-123223449.pc_relevant_paycolumn_v3&utm_relevant_index=1

posted on 2023-08-08 19:06  m_zhuang  阅读(103)  评论(0编辑  收藏  举报