SQL Server 2008 Failover Cluster

最近头儿很是不知道哪里受了刺激,非得搞个Sql Server 2008的数据库群集,没办法.只好硬着头皮去找,去查相关的资料了,终于有了点小成果啊.这里总结一下.顺便拿出来晒晒.希望大家给点建议..弥补我这小菜鸟的不足啊.(第一次写博客~~排版啥的..比较不懂..希望大家见谅)

测试环境:

虚拟机软件:Vmware Esx 3.5.0

虚拟机操作系统:Microsoft Windows Service 2003 Enterprise Edition Sp2

Sql Service:SQL Server 2008


  • 故障转移群集安装

SQL Server故障转移群集的安装,必须基于Windows群集服务(MSCS)的基础之上,有关Windows群集服务的配置在网上有相当多的资料,这里就不多赘述,进入正题前,需要提一提一些重要的内容。


首先,MSCS的安装必须在Server操作系统中,建议使用且操作系统版本有具体的限制这些在安装MSCS的时候就可以知晓,这里也不多说。需要提的一点是SQL Server 2008故障转移群集的安装需要使用到File Stream,由于SQL Server 2008的这一新特性,操作系统中需要安装一个安装补丁kb93744,由于这一补丁的Windows Server 2003的中文版本并未对外进行公布。因而,安装操作过程中,建议使用Windows Server 2003 32bit)英文版,如果一定需要安装中文版本,建议使用64位的Server03操作系统。

其次,MSCS中,默认将共享的首个磁盘设定为仲裁磁盘。这在SQL Server的故障转移群集过程中,是无法通过其规则校验的。因而,在设置共享磁盘时,建议先创建一个较小的(约200M左右)的仲裁磁盘,而后再建立存储数据库共享数据的共享磁盘。

最后,SQL Server的故障转移群集的安装,必须使用配置的域账号中进行安装,否则安装过程中,一些域账号及对应权限的安装会出现问题。

 

SQL Server故障转移群集的安装,包括两大步骤,

一,SQL故障转移群集的准备工作

二,SQL故障转移群集的完成

其中的一大堆相关的步骤..SQL Server 2008的安装向导非常的人性化,也非常的直观,这里就不多废话了....继续下面的配置.



  • 故障转移群集的测试


文档差不多写完了,回过头来看一下,测试的内容,似乎少了一点。这里就再补充补充。

当然咱们先别急,先理解一些概念性的东西,首先看看官方的资料吧:


· SQL Server 服务的资源 DLL 导出两个函数,MSCS 群集管理器使用它们来检查 SQL Server 资源的可用性。一个是 LooksAlive,它是一项简单的检查,可以通过 Windows NT 服务控制管理器来查询服务状态。另一个是 IsAlive,它是一项较严格的检查,可以作为用户探测连接到 SQL Server 以执行一个简单查询。默认情况下,LooksAlive 每 5 秒触发一次,IsAlive 每 60 秒触发一次。可以通过 SQL Server 资源的“高级”选项卡中的 MSCS 群集管理器或者使用 Cluster.exe 命令提示实用工具来更改 LooksAlive 和 IsAlive 的轮询间隔。

· MSCS 必须能够使用 IsAlive 检查来验证故障转移群集实例是否正在运行。这需要使用可信连接来连接到服务器。默认情况下,在群集的节点上未将运行群集服务的帐户配置为管理员,并且 BUILTIN"Administrators 组没有登录到 SQL Server 的权限。只有更改对群集节点的权限时,这些设置才会改变。
确保运行群集服务的组或帐户可以登录到 SQL Server 以执行 IsAlive 检查。如果不能,IsAlive 检查将失败。MSCS 群集服务帐户必须至少拥有 SQL Server 的 public 权限,才可以定期运行 SELECT @@servername。(摘处
MSDN

 

LooksAliverIsAlive是用来确认群集服务中各节点间的“心跳”了。因此,要测试群集中各个节点是否成功,只需要当Cluster Server检测不到当前资源组的所有者的“心跳”的时候,便会发生资源转移了,而这“心跳”由域内Cluster Server来进行检测,也就是说,我们不需要担心发现不了当前活动节点是否已经“停止心跳”了。因此,我们在测试群集是否成功配置其实只需要查看资源是否能成功转移便可了。

 

接下来,我们来模拟活动节点(yfb004,由于当前我们亦使用yfb003作为cluster主服务器,所以不可以断开yfb003)网络中断,来进行一次故障发生情况的测试。

首先,我们将114机器上的外部网卡禁用,模拟网络中断的情况:

设置完成以后,马上到113上,看看,此时,我们会看到,yfb004机器上的IP地址资源出现问题了

紧接着,资源便进行了转移,转移到YFB003上。

等等这些资源都加载完成:

测试通过!

当然,还需要再提一提,IsAliveLooksAliver的设置,我们可以在Cluster Configuration下的Resource Types里可以进行相应的配置。看个示例吧:

如上图示例中所示我将Looks Alive设置为500毫秒,以方便我们在测试的时候更迅速地获取到反应,这样的频率太短了,会影响网络通讯的性能


--未完待续

posted @ 2009-09-08 17:41  老玉米  阅读(6375)  评论(5编辑  收藏  举报