Owen的酒楼

--酒楼上渡过的人生--
生命太短,人生太长,但愿别喝醉了。

导航

DELL服务器结合nagios硬件监控、报警 ZT

Posted on 2011-06-13 16:56  Hicome  阅读(674)  评论(0编辑  收藏  举报
此次安装的dell硬件监控所支持的dell服务器为1950、2950、R410公司服务器有限暂且测试dell这3款服务器型号,测试硬件监控系统程序为Centos 5.4\5.3\5.2 Windows 2003 操作系统。本篇文章为了方便大家监控dell的硬件如风扇转速,主板温度,硬盘状况等等硬件状况,有助于更好地管理服务器的硬件信息。
 
一、 客户端安装dell硬件监控软件:
 
1linux操作系统:
(1)安装OMSA(OM_6.1.0_ManNode_A00.tar.gz)所依赖包
   compat-libstdc++-33-3.2.3-61.i386.rpm
   procmail-3.22-17.1.el5.centos.i386.rpm
   procmail-3.22-17.1.el5.centos.x86_64.rpm
 
(2)修改/etc/redhat-release,在CentOS release 5.4 (Final)后面添加Tikanga (5.3\5.2\版本都需要在后面添加)
 
Vi /etc/redhat-release
CentOS release 5.4 (Final)Tikanga
(3) 安装对应linux对应版本的DELL OMSA软件(OM_6.1.0_ManNode_A00.tar.gz),需新建文件夹,放入OMSA软件,在解压
 
 创建目录:Mkdir OMSA
解压OM:Tar zxf OM_6.1.0_ManNode_A00.tar.gz -C OMSA
进入OMSA目录:Cd OMSA
执行setup脚本:/bin/sh setup.sh
此时会看到一个dell协议按空格键阅读到100%自动跳转到安装界面有三次选择,
输入y, 表示接受协议,
 输入6,表示选择全部组件,
 输入i, 表示安装所选择
安装时提示安装的路径,选择默认路径的就行(/opt/dell/srvadmin)
安装完成之后会自动提示是否启动,请选择是。
 
(4) 拷贝srvadmin-services.sh
srvadmin-services.sh在解压目录下的linux/supportscripts里,需要拷贝过去。
 cp -r 解压目录下的linux/supportscripts /opt/dell/
手动启动,停止,重启相关命令:
 运行Dell OpenManage:
 srvadmin-services.sh start
 停止openManage的命令为:
 srvadmin-services.sh stop
 开机自启动:
 srvadmin-services.sh enable
 关闭开机自启动:
 srvadmin-services.sh disable
 
(5) 重启SNMP服务
Service snmpd restart
 
到此linux客户端dell硬件监控软件安装完毕。
 
2Windows操作系统:
 (1)安装OM-SrvAdmin-Dell-Web-WIN-6.3.0-2075_A00.20.exe
   首先双击OM-SrvAdmin-Dell-Web-WIN-6.3.0-2075_A00.20.exe解压到自定义目录,生成OpenManage目录双击目录进入windows目录,双击setup.exe
   Windows安装简单按照安装提示默认安装就可以,安装成功后会在桌面显示出server Administrator   管理软件图标,此时说明安装成功双击管理软件可以显示出登陆界面账号密码为你本机的管理员账号密码,进入管理界面后,你所能看到的任何硬件都可以监控。
 (2)重启snmp服务
   点击开始运行cmd
   输入:services.msc
   打开服务项找到snmpd服务重启。
 
至此windows客户端dell硬件监控软件安装完毕。
 
说明:安装dell硬件监控软件linux 和windows系统时都有后台免打扰安装,方便如公司有自动安装系统机时整合dell硬件监控软件安装。
 
Windows 免打扰安装参数:
   此时需要提取OpenManage目录下的windows目录内SystemsManagement目录使用此目录内的SysMgmt.msi进行免打扰安装
   %systemdrive%\SystemsManagement\SysMgmt.msi /passive /norestart
Linux 免打扰安装参数:
   再上面所说的执行/bin/sh setup.sh 脚本时,在后面加入-x –a2个参数
   -x参数含义安装所有部件(包括“RAC”,如果有的话)
  别的选择通过将被忽略。
   -a 参数含义—autostart自动安装在组件已经完成后开始安装服务
 
 
 
二、 服务端安装dell硬件监控相关插件:
 (1)安装相关Perl-snmp软件包
   perl-Crypt-DES-2.05-3.2.el5.rf.i386.rpm
   perl-Digest-HMAC-1.01-2.2.el5.rf.noarch.rpm
   perl-Digest-SHA1-2.12-2.el5.rf.i386.rpm
   perl-Socket6-0.23-1.el5.rf.i386.rpm
perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
   安装顺序安装其他包,最后安装perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
 
(2)上传linux版本check_openmanage软件
 上传: check_openmanage-3.6.0.tar.gz
解压:tar zxf check_openmanage-3.6.0.tar.gz
进入目录拷贝:cp check_openmanage /usr/local/nagios/libexec/
 
三、 nagios服务端添加监控设置
实例:
检测的服务器:
define host {
    use             neiwang-server
    host_name       192.168.36.231
    alias           Dell_OMSA
    address         192.168.36.231
}
 
添加的新检测命令
#Openmanage check via SNMP
define command {
    command_name    check_hardware
    command_line    /usr/local/nagios/libexec/check_openmanage -H $HOSTADDRESS$ -p -C opublic -b $ARG1$-b 为黑名单,有专门文档说明)
}
 
define command {
    command_name    check_hardware_alertlog            command_line    /home/check_openmanage/check_openmanage -H $HOSTADDRESS$ -p -C opublic --only=alertlog
}
 
检测OMSA的service写法
# Dell OMSA status
define service {
    use                        neiwang-service
    host_name                  192.168.36.231
    service_description        check_hardware!crtl=0(屏蔽的报警项)
    check_command              check_hardware
}
 
define service {
    use                         neiwang-service
    host_name                  192.168.36.231
    service_description                check_hareware_alertlog
    check_command              check_hardware_alertlog
}
### 
 
重启nagios
 
到此dell服务器硬件监控搭配安装到此结束。

 

转自:

http://lhflinux.blog.51cto.com/1961662/511688