摘要: postgresql CPU使用率告警 处理过程 背景 某项目业务数据库在2月底出现频繁的CPU使用率告警,其中在2月28日一天就出现多达25次的告警,特别是在15:35-16:35时间段出现持续10分钟平线无限接近100%的使用率,监控CPU情况如下: 系统情况如下: PostgreSQL 10. 阅读全文
posted @ 2020-03-13 15:47 jil.wen 阅读(846) 评论(0) 推荐(0) 编辑
摘要: troubleshooting sql server Distribution(分发库优化) 表象 我们某个较核心项目的分发库【Distribution】 磁盘使用接近200G; 监控的阻塞源头中较频繁出现【分发清除: distribution】; 【分发清除: distribution】 job平 阅读全文
posted @ 2020-03-13 15:12 jil.wen 阅读(561) 评论(0) 推荐(1) 编辑
摘要: sql server agent服务无法启动 背景 最近我们一批sql server数据库服务器更换一些硬盘,例行检查服务运行情况时,发现其中有一台服务器的agent无法启动,针对这次处理过程记录如下。 环境情况 Microsoft SQL Server 2017 (RTM-CU14) (KB448 阅读全文
posted @ 2020-03-13 15:00 jil.wen 阅读(3552) 评论(0) 推荐(0) 编辑
摘要: BPE特性 背景 在我们已有的较大的项目上,当数据库比较大且基于数据库开发定制的报表较多的情形下,业务高峰的IO波动非常大。基于这个情况,我们想从数据库的特性出发,sql server 2014开始就发布过一个新特性Buffer Pool Extension (BPE),该特性说白就是内存不够,SS 阅读全文
posted @ 2020-03-13 14:55 jil.wen 阅读(297) 评论(0) 推荐(0) 编辑
摘要: sqlserver 出现dump文件分析 背景 例行检查某项目的数据库日志信息,发现出现比较频繁的dump,这个风险需我们紧急介入,需分析该问题的原因、有多严重、并修复; 服务器环境情况如下: Microsoft SQL Server 2016 (SP1) (KB3182545) - 13.0.40 阅读全文
posted @ 2020-03-13 14:46 jil.wen 阅读(3316) 评论(0) 推荐(1) 编辑
摘要: sqlserver数据库服务异常停止分析 背景 2019年11月13日早上9:37分钟,我们的运维监控系统告警提示某项目数据库服务1433端口无法访问,我们赶紧登陆服务器查看详情,发现数据库服务以及数据库agent服务都已停止,重新手工启动对应的服务恢复生产。接下来我们就需赶紧分析引起这个问题的原因 阅读全文
posted @ 2020-03-13 14:35 jil.wen 阅读(3396) 评论(0) 推荐(2) 编辑
摘要: 数据库无法删除,error:3724 背景 我们迁移一批windows服务器,因有SQLserver 复制,我们需提前测试验证一下环境,所以新建的一个testdb来验证复制配置,验证完毕之后,删除该库的发布订阅之后,发现无法删除testdb,提示error:3724,本次就记录一下处理该问题的步骤; 阅读全文
posted @ 2020-03-13 14:26 jil.wen 阅读(733) 评论(0) 推荐(0) 编辑