1、Nagios监控软件
Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
Nagios和cacti有什么区别呢?简单的来说cacti主要监控流量,服务器状态页面展示;nagios主要监控服务,邮件及短信报警灯,当然也有简单的流量监控界面,二者综合使用效果更好。(附Nagios工作简单逻辑图)
Nagios监控客户端需要借助Nagios插件及NRPE软件来实现,NRPE作为中间的代理程序,接收Nagios服务器端发来的请求,另一端在远程主机上指定的相关的监控信息。
2、Nagios监控服务器构建
wget http://sourceforge.net/projects/nagios/files/nagios-3.x/nagios-3.2.1/nagios-3.2.1.tar.gz/download http://nagios-plugins.org/download/nagios-plugins-1.4.14.tar.gz http://nchc.dl.sourceforge.net/project/nagios/nrpe-2.x/nrpe-2.14/nrpe-2.14.tar.gz /usr/sbin/useradd nagios tar zxvf nagios-3.2.1.tar.gz cd nagios-3.2.1 ./configure --prefix=/usr/local/nagios --with-command-group=nagios make all make install //来安装主程序,CGI和HTML文件 make install-init //在/etc/rc.d/init.d安装启动脚本 make install-config //来安装示例配置文件,安装的路径是/usr/local/nagios/etc make install-commandmode //来配置目录权限 make install-webconf // 配置nagios跟apache整合 make install ;make install-init;make install-config;make install-commandmode ;make install-webconf
1)安装Nagios-plugins
tar zxvf nagios-plugins-1.4.14.tar.gz cd nagios-plugins-1.4.14 ./configure --prefix=/usr/local/nagios --with-nagios-user=nagios --with-nagios-group=nagios make && make install
2)nagios访问控制设置
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
输入两次密码即可,登录页面的时候会用到这个密码.
3)Nagios测试访问
重启nagios ,service nagios restart ;service httpd restart ;
3、Nagios监控配置
默认安装完nagios,配置文件主目录在/usr/local/nagios/下
bin Nagios 可执行程序所在目录 etc Nagios 配置文件所在目录 sbin Nagios CGI 文件所在目录,也就是执行外部命令所需文件所在的目录 share Nagios WEB PHP网页文件所在的目录 libexec Nagios 外部插件所在目录 var Nagios 日志文件、lock 等文件所在的目录 var/archives Nagios 日志自动归档目录 var/rw 用来存放外部命令文件的目录
添加客户端监控步骤
Cp localhost.cfg 192.168.0.113.cfg 把默认配置文件里面的locahost、127.0.0.1、check_local替换成最新 sed -i 's#localhost#192.168.0.113#g;s#127.0.0.1#192.168.0.113#g;s#check_local#check#g;s#linux-servers#192.168.0.113#g ' 192.168.0.113.cfg 在nagios.cfg 36行后加入cfg_file=/usr/local/nagios/etc/objects/192.168.0.113.cfg sed -i '36a cfg_file=/usr/local/nagios/etc/objects/192.168.0.113.cfg' /usr/local/nagios/etc/nagios.cfg 最后执行: /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg没有报错即可。
默认有报错,因为没有在客户端安装nagios插件及NRPE,需删掉配置文件里disk、swap、process、user、cpu等监控配置段:
如下是刚刚添加的默认的客户端监控图