今天应该很高兴
今天应该很高兴。
从过年前开始,所管理的系统就没有安生过,经常出现运行缓慢,前台反应慢甚至死机的现象。通过多方会诊,除了知道系统负载从C网割接过来之后变得越来越重之外,都一直没有找到确切的原因,就更别说找到解决的办法。过年的时候因为负载很轻没有发生什么问题,但从正月十五之后就开始出现了严重问题:慢,甚至无法使用系统,我们紧急对系统进行扩容之后系统情况有所缓解,但是还是会出现单个WAS实例CPU占用高,马上就会有前台出现应用相应缓慢的问题。这个现象的根本原因没有人能解答,即使IBM的工程师来也没有办法解决。昨天晚上我们调整了WAS的两个参数(扩大线程池以及改变垃圾回收策略),并且对应用进行了优化,牺牲了一些安全性(不验证所有对服务器的request做验证)。今天终于安定了一整天。但现在还不能下结论已经解决问题,只是看到了希望。
另外一个让人高兴的事情就是终于搞定了MQ的队列深度侦测。说起来这个应该是一个非常简单的程序,但是因为使用了java这一我非常不熟悉的语言,另外对MQ的理解也是半桶水,按照网上找的资料却报错,没有师傅指导,结果卡住了...今天另外找了份资料才发现原来代码写错了。终于搞定了困惑我近半个月的问题。
但是,这个世界上总还是有“但是”这么一个词语让人在高兴的时候沮丧。下班时接到一个棘手的问题,源自去年11月完成的C网工作,由于工作上的不过细,导致遗漏了一个比较重要的数据没有迁移过来,很可能会导致一些高端用户投诉,而且还是费用问题。这事让我整个晚上都高兴不起来。虽说是结束了的工作,而且是很多人一起完成的工作,但在我看来,在其中我是一个主要协调人和管理者,这个失误让我很自责和郁闷,虽然有很充分的理由说明当时无法顾及所有方面,但是始终是自己的工作没有深入细致下去,这个问题对于两个厂商而言,是可以相互推诿,说是对方该做的事情,但是对于我来说,没有站在全局的高度去发现问题并解决问题,就是失职。
这个事情都不知道该往哪里报,似乎领导们都不会对这样一件事情操心了,希望明天能找到好的解决方案。