Windows Cluster失败后,AlwaysOn在残存Server节点上快速恢复DB的详细步骤

AlwaysOn是一种集合了高可用和灾难恢复两种功能的技术，它支持一个或多个数据库整体的发生故障转移，它实现了一定程度上的负载均衡，减轻了主服务器的压力，是目前最好的一种选择。那么当极端情况发生时，集群大多数节点都挂掉了，数据库所在的主节点Server也挂掉了。即当Windows 集群 Fail 时，如何快速从尚且存活的少数节点中，挑选一个来承接数据库服务。

1:测试目的

Windows Failover Cluster若因故障server节点太多, 会使整个Cluster fail, 此时其他残存server节点上的DB数据库都会变成Recovery Pending状态, 无法使用。下面的测试就是顽强还活着的节点中，挑一个使数据库快速恢复可用状态。

2:测试环境

Node1	Node1	Node1	ClusterIP	ListenerIP
172.XXX.XXX.112	172.XXX.XXX.113	172.XXX.XXX.114	172.XXX.XXX.115	172.XXX.XXX.117
ALWAYSONTEST01	ALWAYSONTEST02	ALWAYSONTEST03
Primary;Synchronous Commit	Secondary;Synchronous Commit	Secondary;Asynchronous Commit

登录此时的主节点，查看如下：

各节点运行正常。

3:测试步骤

Step 1：关闭2个节点（XXX.112;XXX.113）使 Windows Cluster Fail，Ping Cluster IP 显示超时。

----剩余172.XXX.XXX.114 保留非同步的副本。

Step 2：登入唯一的存活的节点172.XXX XXX.114，SQL 显示错误如下：

Step 3：刷新DB，查询可用性组和DB的状态已分别处于Resolving 和Recovery Pending，数据库不可用。

此时Listener IP 也不可用

Step 4: 查看对应的Cluster 服务对应的Service Name

（Server ManageràLocal ServeràServices）

或(Server ManageràToolsàComponent ServicesàServices)

Step5：手动停止群集服务

---- net.exe stop Cluster_Name(实为Service name)

成功关闭后172.XXX.XXX.115无法Ping 通

Step6：在单一节点上使用强制仲裁，藉以启动WSFC群集

---- net.exestart Cluster_Name/forcequorum

成功启动后Cluster IP 可以Ping 通；Listener IP 无法Ping 通

通过FailOver Cluster Manger 查看节点和AG的状态如下:

下图为各节点状态；

下图为高可用性组的状态

Step 7：重启SQL Serveice 服务

----（个别情况下：首先，Disable后restart，然后再Enable后restart）

Step 8：执行可用性群组的强制性手动容错转移

---- ALTER AVAILABILITY GROUP group_name FORCE_FAILOVER_ALLOW_DATA_LOSS （其中 group_name 是可用性组的名称）

Step 9：可用性组的状态变为Primary状态，DB显示同步，listener IP也为可用

步骤概况总结：

Windows Failover Cluster若因故障server太多, 会使整个cluster fail, 此时在其他残存server的DB, 会在Recovery Pending状态, 无法使用, 采用以下可使DB恢复使用.

停止群集服务 --> 强制仲裁以启动WSFC群集 --> 重启SQL Serveice服务 --> 执行可用性群组的强制性手动容错转移.

4:补充说明

此时Restart测试过程中关闭的节点（XXX.112;XXX.113），部署其上的DB显示Not Synchronizing。

本文版权归作者所有，未经作者同意不得转载,谢谢配合！！！

posted @ 2019-06-22 17:51 东山絮柳仔阅读(1065) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· ［.NET］调用本地 Deepseek 模型
· 一个费力不讨好的项目，让我损失了近一半的绩效！
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结

阅读排行：
· 一个费力不讨好的项目，让我损失了近一半的绩效！
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单！
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库

公告

昵称：东山絮柳仔
园龄： 9年7个月
粉丝： 123
关注： 5

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔档案 (357)

文章档案 (1)

2018年9月(1)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:Python读取Ansible playbooks返回信息
这里考虑使用ansible的cailback是不是更好
--moonpanda
2. Re:名言小抄（八）--曾国藩
补一个哈，“一勤天下无难事，一懒世间万事休”。很喜欢曾国藩，其中一点，就是，在我看来，曾国藩真是一个没有天子天赋的人，年轻时又轻浮懒惰，身体素质也很差，可以说是没啥优点了。但是后来，真的是彻头彻尾...
--thevil
3. Re:通过Python将监控数据由influxdb写入到MySQL
@cc_99 这个我们没有验证。监控收集上来的表还是很多的，我们这儿只是聚合分析我们最关心的部分表。...
--东山絮柳仔
4. Re:通过Python将监控数据由influxdb写入到MySQL
self.use_cpu_table = 'cpu' # cpu使用率表 self.phy_mem_table = 'mem'# 物理内存表 self.traffic_table = 'net'# 接...
--cc_99
5. Re:通过Python将监控数据由influxdb写入到MySQL
博主你好，我想问在选择influxdb的表的时候是否可以选择所有表？
--cc_99

支持DeepSeek的编程助手