【Nagios】安装教程(虚拟机版本+云服务器)

  1. Nagios概要

Nagios是一款开源的免费网络监视工具,能有效监控WindowsLinuxUnix的主机状态,交换机路由器等网络设备,打印机等。

Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。

所以后期可以进行插件的编写来进行对服务器的监控

  1. Nagios安装步骤
    1. 实验环境

IP

OS

功能

安装的软件

192.168.10.100

Centos

server

Apache/php/Nagios/Nagios-plugin/nrpe

192.168.2.48

Ubuntu

Client

Nagios-pluginnrpe

192.168.10.102

centos

client

Nagios-pluginnrpe

Server安装了nagios软件,对监控的数据做处理,并且提供web界面查看和管理也可以对本机自身的信息进行监控。Client安装了NRPE等客户端,根据监控机的请求执行监控,然后将结果回传给监控机

  1. 前期工具

必要压缩包:

环境内必要工具:

        1Apache    安装:yum install httpd

验证:浏览器输入:localhost80

成功页面:

        2mail    安装邮件服务:yum install sendmail mailx

                    开启邮件服务:systemctl enable sendmail.service

        3php    安装命令:yum install php

  1. Nagios-server服务端安装
    1. 安装nagios

    增加用户,用户组

    命令:useradd nagios

    命令:usermod -a -G nagcmd apache

              usermod -a -G nagcmd nagios

    验证:

   

配置:./configure --with-command-group=nagcmd

   

编译:make all

成功页面:

   

编译: make install-init

make install-config

make install-commandmod

make install-webconf

成功页面:

   

验证是否安装完整:ll /usr/local/nagios

   

   

修改报警邮箱     命令:vim /usr/local/nagios/etc/objects/contacts.cfg

define contact部分

   

修改登录nagios网页密码    命令:htpasswd -c /usr/local/nagios/etc/htpasswd.users nagios

   

修改权限     命令:sed -i 's#nagiosadmin#nagios#g' /usr/local/nagios/etc/cgi.cfg

[root@hadoop00]/var/spool/mail# grep nagios /usr/local/nagios/etc/cgi.cfg

   

验证nagios的配置文件    命令:/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

   

   

  1. 安装nagios-plugin

命令:解压:

配置:./configure --with-nagios-user=nagios --with-nagios-group=nagcmd

编译:make &&make install

   

启动服务

systemctl enable nagios.service

systemctl start nagios.service

查看状态systemctl status nagios.service

   

   

          

        登录网址:localhost/nagios

   

   

  1. 安装nrpe

解压:tar xvzf [压缩包]

进入文件夹

配置:./configure --with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios --with-nagios-up=nagios --enable-command-args --enable-ssl

   

   

启动nrpe/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d

验证是否安装完好:ls /usr/local/nagios/libexec/ |grep check_nrpe

结果显示check_nrpe

显示5666端口的nrpe

  1. Nagios-client客户端安装

    创建用户组

    useradd nagios

安装nagios插件

安装nrpe

安装步骤省略

修改nrpe配置文件    命令:vim /usr/local/nagios/etc/nrpe.cfg

主要修改allowed_hosts部分,在后面增加nagios服务端

启动nrpe/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d

检测是否有5666的端口启动    命令:netstat –lntp|grep nrpe

  1. 验证

    Web页面的监控

    修改nagios.cfg文件    命令:vim /usr/local/nagios/etc/nagios.cfg

    在下面这行,添加监控客户端文件web1.cfg

cfg_file=/usr/local/nagios/etc/objects/localhost.cfg

   

cfg_file=/usr/local/nagios/etc/objects/web1.cfg

在文件夹中添加文件

进入文件夹objectcd /usr/local/nagios/etc/objects/

拷贝localhost文件:cp localhost.cfg web1.cfg

修改web1.cfg    命令:sed -i 's#localhost#192.168.10.101#g;s#127.0.0.1#192.168.10.101#g;s#check_local#check#g ' web1.cfg

验证配置文件是否错误

验证:/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

如果0错误

则进行重启nagios服务    命令:systemctl restart nagios.service

打开网页

进入host页面

   

客户端在服务端的nrpe监控

/usr/local/nagios/libexec/check_nrpe -H 192.168.10.101

显示结果:NRPE v3.2.0

  1. 命令

在这里会有一些命令,现在进行学习。

 

查询命令:主要是有关监控服务方面的,后期可以通过编写插件进行服务资源监控。

command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10

command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20

command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p 文件目录

command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z

command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200

日志服务:

主要文件目录:/var/log/message

        /var/log/syslogs

        Pkill nrpe

/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d

/usr/local/nagios/libexec/check_nrpe -H localhost

 

  1. 问题
    1. 虚拟机为监控服务端、云服务器为监控客户端,一直连不上去,报错ip地址 not talk to us

      解决办法:将主机ip加入allowed_hosts

    2. Nrpe验证的时候提示 ip地址 No host to route

      解决办法:防火墙问题。第一种将端口加入防火墙允许访问服务中;第二种:iptable –f(在服务端)

    3. 安装nrpe,编译的时候提示以下信息:checking for SSL headers... configure: error: Cannot find ssl headers

      解决办法:原因是缺少openssl-devel包:

      Centosyum -y install openssl-devel

      Ubuntuapt-get install libglobus-openssl-devlibssl-dev

    4. 如果提示"Whoops! Error: Could not read object configuration data! "

      解决办法:因为没有启动nagios后台进程,执行以下命令

      /usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg

    5. 查看nagios服务状态,提示、/run/naigos.lockpermission denied

       

      解决办法:修改权限or重新找一个文件,进行更新lockfile

查看出错状态 systemctl status nagios.service |journalctl –xe

https://serverfault.com/questions/146830/nagios-woudnt-start-now-wont-stop

  1. 拉倒就
posted @ 2019-12-23 16:21  夏立  阅读(787)  评论(0编辑  收藏  举报