摘要:AG排查和监控指南1. 排查场景如下表包含了常用排查的场景。根据被分为几个场景类型,比如Configuration,client connectivity,failover和performance。Scenario笔记Scenario TypeDescriptionTroubleshoot Alwa...
阅读全文
11 2015 档案
摘要:AG排查和监控指南1. 排查场景如下表包含了常用排查的场景。根据被分为几个场景类型,比如Configuration,client connectivity,failover和performance。Scenario笔记Scenario TypeDescriptionTroubleshoot Alwa...
阅读全文
摘要:使用Powershell监控AlwayOn健康1.基本命令概述AlwayOn Dashboard是很有用的查看整体AG健康状况的工具。但是这个工具不是用于7*24监控的。如果应用程序夜间发送严重的问题,Dashboard并不会有任何提示。那么可以使用Powershell命令来获取并通过SQL Age...
阅读全文
摘要:健康模型扩展第一部分已经介绍了AlwayOn健康模型的概述。现在是创建一个自己的PBM策略,然后设置为制定的归类。创建这些策略,创建之后修改一下配置,dashboard就会自动评估这些策略。场景,你有一个异步副本,当被primary落下太多的时候想要在dashboard上显示。一下是创建策略放入健康...
阅读全文
摘要:健康模型概述在成功部署AG之后,跟踪和维护健康状况是很重要的。1.AG健康模型概述AG的健康模型是基于策略管理(Policy Based Management PBM)的。如果不熟悉这个特性,可以查看:使用基于策略的管理来管理服务器PBM的核心是策略,策略有以下部分组成:1.目标,策略运行在有一组或...
阅读全文
摘要:监控AG性能AG的性能的性能方面,在关键任务数据库上进行语句级维护性能是很重要的。理解AG如何传输日志到secondary副本对评估RTO和RPO,表明AG是否性能不好。1. 数据同步步骤为了评估是否有性能问题,首先需要理解同步过程。性能问题可能出现在同步过程的任何一个环节,瓶颈的定位可以让你深入的...
阅读全文
摘要:AlwaysOn Ring Buffers一些AlwaysOn的诊断信息可以从SQL Server ring buffers。或者从sys.dm_os_ring_buffers。ring buffer在SQL Server启动的时候被创建,SQL Server系统为内部诊断记录警告。通过以下查询获取...
阅读全文
摘要:AlwaysOn等待类型当排查AlwaysOn延迟,等待统计信息可以在DMV中查看累计的AlwaysOn等待类型。查看AlwaysOn等待类型SELECT * FROM sys.dm_os_wait_statsWHERE wait_type LIKE '%hadr%'ORDER BY wait_ti...
阅读全文
摘要:AG扩展事件SQL Server 2012定义了一些关于AlwaysOn的扩展事件。你可以监控这些扩展事件来帮助诊断AG的根本问题。你也可以使用以下语句查看扩展事件:SELECT * FROM sys.dm_xe_objects WHERE name LIKE '%hadr%'1.AlwaysOn健...
阅读全文
摘要:DMV和系统目录视图这里主要介绍AlwaysON的动态管理视图,可以用来监控和排查你的AG。在AlwaysOn Dashboard,你可以简单的配置的GUI显示很多可用副本的DMV和可用数据库通过右击各自的表头并且选择你要加入和隐藏的DMV。更多关于DMV信息查看:AlwaysOn Availabi...
阅读全文
摘要:AlwaysOn健康诊断日志为了监控primary可用副本的健康状况,SQL Server资源DLL使用SQL Server2012的过程sp_server_diagnostics。SQL Server resource DLL维护了一个专用的连接到SQL Server实例,通过这个SQL Serv...
阅读全文
摘要:CLUSTER.LOG(AG)作为故障转移资源,在SQL Server和windows故障转移集群服务的资源DLL(hadrres.dll)之间有额外的内部交流,DLL无法被SQL Server监控。WSFC log,CLUSTER.LOG可以诊断WSFC集群或者SQL Server Resourc...
阅读全文
摘要:SQL Server错误日志(AG)SQL Server错误日志会记录影响AG的时间,比如:1.和Windows故障转移集群交互2.可用副本的状态3.可用数据的状态4.AG endpoint的状态5.AG Listener的状态6.SQL Server resource DLL和SQL Server...
阅读全文
摘要:排查:Primary上的修改无法在Secondary体现客户端进程在primary上修改成功,但是在Secondary上却无法看到修改结果。这个case假设你的可用性组有同步的健康问题。很多情况下这个情况会在几分钟之后自动解决。如果几分之后依然看不到,那么可能在同步的工作流上有瓶颈问题。这个瓶颈会因...
阅读全文
摘要:排查:AG超过RPO在异步提交的secondary上执行了切换,你可能会发现数据的丢失大于RPO,或者在计算可以忍受的数据都是超过了RPO。1.通常原因1.网络延迟太高,网络吞吐量太低,导致Primary的日志堆积2.磁盘IO瓶颈导致LOG固化速度降低2. 网络延迟太高,网络吞吐量太低,导致Prim...
阅读全文
摘要:排查:AG超过RTO自动故障转移或者手动转移之后,没有数据都是,你可能会发现切换时间超过了你的RTO。或者当你评估切换时间同步提交secondary副本,发现超过了你的RTO。1. 通常原因通常引起故障转移超过RTO的原因:1.报表负荷堵塞了Redo线程。2.因为资源争用,Redo线程被落下。2. ...
阅读全文
摘要:排查AG配置本文主要用来帮助排查在AG配置时出现的问题,包括,AG功能被禁用,账号配置不正确,数据库镜像endpoint不存在,endpoint不能访问。SectionDescriptionAlwaysOn Availability Groups Is Not Enabled如果实例没有启动AG特性...
阅读全文
|