SCOM 2012 监控实践

最近做项目中，使用到system center 的 scom 2012 产品，去监控客户的服务器和网络设备，其中客户提到需要这个产品要做到

能够识别监控过程中，服务器或者网络设备的性能瓶颈，我刚开始感觉， scom对这种需求很无能无力，首先这个产品定位是监控，并不是分析，

所以它的一切重心在于搜集设备信息，供客户去参考判断是否为正常状态，所以它的使用场景一般在于，保存监控数据，以便在发生异常的时候可以及时

去寻找问题根源，第二个重要点在于警报，在设定一系统的指标后，对超出这些指标的对象示警。

客户的最理想状态是，它的设备或者应用发生问题的时候，不必再去看监控数据，就可以得知哪里出现问题。这其实是可以通过设定一些监视器去解决用户的问题，

客户想知道数据库脚本运行缓慢，想知道原因

我的步骤是这样的：

1. 首先考虑会影响数据库脚本运行缓慢的原因，可以根据Query-Performance-Tuning-Start-To-Finish-Rally这本书里面的要素定下监视指标

2. 根据监视指标，做多个监视器，如SQL脚本编译时间监视器， SQL缓存命中率， SQL 文件读写速度，然后对这些监视指标做知识库，方便问题查找。

这样，运行监控，当监视出现异常的时候，就可以立刻发现数据库脚本是哪里出现问题，如脚本没有使用索引，导致大量表查询，或者脚本没有使用变量，导致重复编译等等情况。

posted @ 2013-01-07 14:15 一只老鼠阅读(517) 评论(0) 编辑收藏举报

刷新页面返回顶部