随笔分类 -  Linux

主要工作内容
使用shell脚本分析Nagios的status.dat文件
摘要:前言Nagios的安装和配置以及批量添加监控服务器在我前面的文章中已经讲的很详细了。我们知道,Nagios的网页控制页面(一般为http://nagio.domain.com/nagios)里可以显示监控的服务器、手动检测监控的服务、禁用报警通知等。当我们维护的时候一般都要先停掉报警,最简单的方式就是在网页里设置报警忽略。如下图所示,如监控memory后面紧跟的银色方框就代表disable notification for this service.但是在维护完成之后很可能就忘记重新开启服务,会造成如下图所示情况,以至于真正出问题后报警没有发出。status.dat文件结构那么今天写的文章就是 阅读全文

posted @ 2013-08-16 18:05 Yiffy 阅读(1840) 评论(4) 推荐(0) 编辑

对zabbix监控磁盘性能的补充
摘要:原因在上一篇文章中,我写了完整的磁盘监控步骤,希望对大家有所帮助。但是这里还需要作出一点补充。根据上一篇文章的内容,我是使用iostat命令不停的收集磁盘的信息,然后写入到/tmp/iostat_ouput文件中,如果执行时间太长会造成磁盘占用空间大的问题,在我的实际测试中,执行了3个月后大概占用了200M空间,对于物理机来说是不大的,但是部分虚拟机本身就只分配了20G的空间,这样空间就比较紧张。所以需要定期清理,但是虚拟机太多,不可能一台一台人工的去弄。puppet实现定期清理前面我写过一篇文章,使用puppet管理500多台服务器,其中只说了批量推送puppet客户端,puppet本身的脚 阅读全文

posted @ 2013-08-14 12:11 Yiffy 阅读(1043) 评论(0) 推荐(0) 编辑

zabbix实现对磁盘性能动态监控
摘要:前言zabbix一直是小规模互联网公司服务器性能监控首选,首先是免费,其次,有专门的公司和社区开发维护,使其稳定性和功能都在不断地增强和完善。zabbix拥有详细的UI界面和分组策略,在被监控的服务器上安装好agent后,无需添加任何监控选项,因为zabbix自带一些必要的监控,如agent.pin... 阅读全文

posted @ 2013-08-12 17:01 Yiffy 阅读(14373) 评论(4) 推荐(5) 编辑

puppet的一个Bug
摘要:前篇文章写了使用puppet管理500多台服务器,当然只是一部分,最主要的还是puppet脚本的编写,这个我会在以后的文章中一点一点写出来。今天要写的是puppet的一个bug,版本是puppet 3.1.1在使用puppet的过程中,发现一处bug,希望大家了解一下,以免出现这种情况。刚在看一台服务器的crontab的时候,本身crontab配置如下关键问题出现在红框中,我做了个操作,先/etc/init.d/puppet stop然后注释掉 * * * * * /infra/crontab/loadquery.sh >/dev/null 2>&1 这一行。再/etc/i 阅读全文

posted @ 2013-08-07 14:42 Yiffy 阅读(442) 评论(0) 推荐(0) 编辑

puppet批量管理500多台服务器
摘要:前言puppet使用了有一段时间了,之前写的手顺书一直未发布到blog上来,今天正好有空,写下一点笔记。公司在用的服务器有500多台,基本都为CentOS,版本有5和6两种,管理起来很不方便,尤其是部署监控,其中有大量重复性工作,使用puppet可以方便很多。简介安装前,简介当然是一定要有的啦,简单介绍下吧。puppet是基于客户端和服务器端的C/S架构,基于ruby开发。所以,你要明白,安装puppet,就需要安装配置ruby。web管理界面类似于redmine的安装,使用apache的passenger模块整合。服务器端部署1、Download and install packagesUR 阅读全文

posted @ 2013-07-23 11:51 Yiffy 阅读(3724) 评论(1) 推荐(1) 编辑

解决zabbix的cannot allocate shared memory of size错误
摘要:问题状态:zabbix_agentd不能启动,系统CentOS 5.8 i386原因分析:这是因为内核对share memory的限制造成的。用到如下命令ipcs [-m|l|a],sysctl [-a|p][root@server01 ~]# ipcs -l------ Shared Memory Limits --------max number of segments = 4096max seg size (kbytes) = 0max total shared memory (kbytes) = 0min seg size (bytes) = 1------ Semaphore Lim 阅读全文

posted @ 2013-06-08 12:05 Yiffy 阅读(4035) 评论(0) 推荐(0) 编辑

内网监控利器——Nagios
摘要:在游戏运维中有最长用的就是使用nagios监控游戏服务器。nagios是一款比较成熟的监控软件。对被监控的主机从负载到进程、网络端口、系统服务等都能做监控,而且当出现问题时候能发出邮件警报。一、nagios的安装(root用户下安装)安装必要的包yum install httpd php gcc glibc glibc-common gd gd-devel建立相应的用户和用户组useradd -m nagiospasswd nagiosgroupadd nagcmdusermod -a -G nagcmd nagiosusermod -a -G nagcmd apache下载并解压nagios 阅读全文

posted @ 2013-06-06 12:38 Yiffy 阅读(1095) 评论(0) 推荐(0) 编辑

搭建redmine全攻略——与apache整合(CentOS 5.8 64位)
摘要:前言 redmine(http://www.redmine.org/)是一款项目管理软件,由ruby编写,以网页的形式呈现。正好公司需要单独搭建一套这个系统,与其说是搭建,更应该说是升级。任务:①在阿里云服务器上搭建redmine系统,我用的最新版redmine 2.1.4 ②导入之前同事用redmine1.2.0搭建的数据,使用的是MySQL数据库。安装Step 1 - Redmine application首先是软件的下载地址:redmine 2.1.4、ruby 1.8.7、rubygems 1.8.24redmine:http://rubyforge.org/frs/?grou... 阅读全文

posted @ 2012-12-20 21:12 Yiffy 阅读(9633) 评论(7) 推荐(1) 编辑

导航