随笔分类 - 监控 - 自动化运维
摘要:这几天部署了一台ARM架构的linux系统的监控,服务器系统上没有任何工具可以获取数据来获取端口流量,yum,apt-get软件包管理工具都没有,所以想获取数据比较困难。 最终决定使用iptables来添加几条指定端口的规则来统计入站流量和出站流量 入站流量在INPUT上添加 监控10010端口的入
阅读全文
摘要:需求:监控集群里面所有Java进程的内存使用情况。 查看linux系统里面有哪些java进程在运行:jps命令 [root@localhost zabbix]# jps 26490 YarnTaskExecutorRunner 12012 NodeManager 14047 YarnTaskExec
阅读全文
摘要:zabbix的网络发现 网络发现的好处: 加快zabbix部署 简化管理 无需过多管理就能在快速变化的环境中使用zabbix zabbix网络发现给予以下信息 IP范围 可用的外部服务(FTP,SSH,WEB,POP3,IMAP,TCP等) 来自zabbix agent的信息 来自snmp agen
阅读全文
摘要:目录 1、下载docker 2、下载相关镜像文件 3、创建一个供zabbix系统使用的网络环境 4、创建一个供mysql数据库存放文件的目录 5、启动mysql容器 6、为zabbix-server创建一个持久卷 7、启动zabbix-server容器 8、创建语言存放目录 9、启动zabbix-w
阅读全文
摘要:目录 1、自定义一个钉钉群组 2、自定义脚本告警 3、创建媒体类型 4、为用户指定媒介类型 5、更改触发器表达式进行测试 1、自定义一个钉钉群组 群组里面添加一个自定义机器人 会有一个webhook地址,这个地址要记住 安全设置暂时选择自定义关键词,定义一个关键词zabbix ,即我发送给钉钉告警文
阅读全文
摘要:目录 1、在zabbix-server端下载mailx 2、配置mailx配置文件 3、查看zabbix-server设置的 AlertScriptsPath变量 4、在对应路径下面编写邮件脚本 5、创建一个媒介类型 6、为用户指定媒介类型 7、更改触发器表达式进行测试 1、在zabbix-serv
阅读全文
摘要:目录 1、创建动作Actions 动作触发流程 创建一个动作 2、配置 Media types 媒介类型,添加一个发件邮箱来发送告警邮件 3、配置 Users Media,添加一个收件邮箱来接收告警邮件 4、更改一个触发器表达式来触发动作Action,最终发送告警邮件给接收邮箱 5、登录接收告警通知
阅读全文
摘要:目录 1、主机组Host groups配置 创建主机组 编辑 将一个主机添加至刚才创建的主机里面 2、用户参数UserParameter设置 示例: 添加一个参数:show.host.messages 模拟zabbix模板里面的参数再添加一个userparameter 3、触发器设置 示例: 4、
阅读全文
摘要:目录 1、 配置zabbix的yum源 2、下载zabbix-agent 3、配置zabbix-agent的配置文件 4、关闭防火墙,selinux 5、重启zabbix-agent 6、连通性测试,在zabbix-server服务器上面使用zabbix_get获取zabbix-agent服务器上的
阅读全文
摘要:目录 1.1、zabbix4.0架构图 1.2、zabbix的进程 1、 zabbix server 2、zabbix agent 3、 zabbix proxy 4、 java gateway 5、zabbix get 1.3、zabbix的几种工作方式 1、通过zabbix agent 2、通过
阅读全文
摘要:目录 1.1、添加 Zabbix 软件仓库 1.2、安装 Server/proxy/前端 1.3、创建数据库 1.4、导入数据 1.5、为 Zabbix server/proxy 配置数据库 1.6、 启动 Zabbix server 进程 1.7、zabbix前端配置 SELinux 配置 1.8
阅读全文
摘要:目录 为什么需要ansible? 什么是ansible? ansible的组成 ansible实验: 1、首先使用ansible(我设置的安装ansible软件的主机名)与其他两台linux服务器建立免密通道 2、在ansible机器上面安装ansible工具 3、配置 2、ansible模块的使用
阅读全文
摘要:目录 知识点1:为什么需要监控? 一些常见的监控软件: 知识点2:prometheus 架构图 prometheus的组件 prometheus获取数据的方式: 知识点3:使用容器起一个prometheus 查看prometheus web端 访问prometheus(localhost:9090/
阅读全文
摘要:目录 知识点1:系统性能监控 1.1 cpu性能:top命令、uptime命令、w命令 1.1.1 什么是load average? 1.1.2 让top命令按内存使用率来显示进程信息(默认是根据cpu使用率来排序的) 1.2 内存 :top命令,free命令 使用top命令来查看内存使用情况 1.
阅读全文