本指南提供了创建和配置服务器群集的步骤指南,可帮助您在运行 Microsoft Windows Server 2003 Enterprise Edition 和 Windows Server 2003 Datacenter Edition 操作系统的服务器上创建和配置使用共享磁盘的典型单一仲裁设备多节点服务器群集。
本页内容
简介 | |
服务器群集配置清单: | |
群集安装 | |
配置群集服务 | |
验证群集安装 | |
配置第二个节点 | |
安装后配置 | |
测试安装 | |
附录 | |
相关链接 |
简介
服务器群集是一组协同工作并运行 Microsoft Cluster Service (MSCS) 的独立服务器。服务器群集为资源和应用程序提供了高可用性、故障恢复能力、伸缩性和可管理性。
服务器群集允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。
对于“Windows 群集”解决方案,使用“高可用性”这个术语要比使用“容错”更为合适。容错技术提供更高层次的弹性和恢复能力。容错服务器通常使用深层硬件冗余,加上专门的软件,几乎可以即时地恢复任何单一的硬件或软件错误。这些解决方案要比“Windows 群集”解决方案昂贵得多,因为企业必须为处于闲置状态等待错误的冗余硬件支付费用。
服务器群集无法保证无间断运作,但是确实能够为多数关键任务应用程序提供足够的可用性。群集服务可以对应用程序和资源进行监控,并能够自动识别和恢复众多故障状况。这为在群集中管理工作负荷提供了灵活性。另外,还提高了整个系统的可用性。
群集服务的优点包括:
• |
高可用性:通过服务器群集,资源 (例如:磁盘驱动器和 Internet 协议 (IP) 地址) 的所有权会自动从故障服务器转移到可用的服务器。当群集中的某个系统或应用程序发生故障时,群集软件会在可用的服务器上重新启动故障应用程序,或者将工作从故障节点分散到剩下的节点上。因此,用户只会在瞬间感觉到服务的暂停。 |
• |
故障恢复:当故障服务器重新回到其预定的首选所有者的联机状态时,群集服务将自动在群集中重新分配工作负荷。该特性可配置,但默认禁用。 |
• |
可管理性:您可以使用“群集管理器”工具 (CluAdmin.exe),将群集作为一个单一的系统进行管理,并将应用程序作为单一服务器上应用程序进行管理。您可以将应用程序转移到群集中的其他服务器。“群集管理器”可用于手动平衡服务器的工作负荷,并根据计划维护发布服务器。您还可以从网络中的任何位置监控群集、所有节点及资源的状态。 |
• |
伸缩性:可以扩展群集服务以满足需求的增长。当具有群集意识的应用程序的总体负荷超出了群集的能力范围时,可以添加更多的节点。 |
本文档提供了创建和配置服务器群集的分步操作指南,可以帮助您在连接到共享群集存储设备且运行 Windows Server 2003 Enterprise Edition 或 Windows Server 2003 的服务器上创建和配置服务器群集。本文档的目的是为了指引您完成安装典型群集的步骤,并未解释如何安装群集应用程序。而对于实施非传统仲裁模型的“Windows 群集”解决方案 (如多数节点集 [MNS] 群集和地理位置分散的群集) 也不予以讨论。有关服务器群集概念以及安装和配置步骤的其他信息,请参见“Windows Server 2003 联机帮助”。
服务器群集配置清单:
本清单可帮助您准备安装过程。清单后面是具体的步骤指南。
软件要求
• |
群集中的所有计算机上均安装有 Microsoft Windows Server 2003 Enterprise Edition 或 Windows Server 2003 Datacenter Edition。 |
• |
一个名称解析法,如:域名系统 (DNS)、DNS 动态更新协议、Windows Internet 名称服务 (WINS)、HOSTS 等等。 |
• |
一个现有的域模型。 |
• |
所有的节点必须是同一个域的成员。 |
• |
一个域级帐户,必须是每个节点上的本地管理员组的成员。建议采用专用帐户。 |
硬件要求
• |
群集硬件必须可以在群集服务硬件兼容性列表 (HCL) 中找到。要查找最新的群集服务硬件兼容性列表,请访问位于 http://www.microsoft.com/whdc/hcl/default.mspx 的“Windows 硬件兼容性列表”,然后搜索群集。整个解决方案必须得到 HCL 认证,而不仅仅是个别组件。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 309395 Microsoft 对于服务器群集和硬件的支持策略 请注意:如果您正在存储区域网络 (SAN) 上安装该群集,并计划让多个设备和群集与该群集共享 SAN,那么该解决方案也必须服从“群级/多群集设备硬件兼容性列表”。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 304415 针对附加到相同 SAN 设备的多群集支持 |
• |
两个海量存储设备控制器:小型计算机系统接口 (SCSI) 或光纤通道。一个本地系统磁盘,用于在其中一个域控制器上安装操作系统 (OS)。一个用于共享磁盘的独立外围组件互连 (PCI) 存储控制器。 |
• |
群集中的每个节点拥有两个 PCI 网络适配器。 |
• |
将共享存储设备附加到所有计算机的存储电缆。请参见制造商的说明文档以了解存储设备的配置信息。请参见本文后面的附录,了解有关使用 SCSI 或“光纤通道”所需的特定配置。 |
• |
对于所有的节点,一切硬件都应相同,对应正确的插槽、设备卡、BIOS、固件修订版等等。这将使配置变得更加简单,同时可消除兼容性问题。 |
网络要求
• |
一个唯一的 NetBIOS 名称。 |
• |
每个节点上的所有网络接口均拥有静态 IP 地址。 请注意: “服务器群集”不支持使用由动态主机配置协议 (DHCP) 服务器分配的地址。 |
• |
接入一个域控制器。如果群集服务无法验证用于启动服务的用户帐户,可能导致群集发生故障。建议您在群集所在的同一个局域网 (LAN) 上安装一个域控制器,以便确保其可用性。 |
• |
每个节点至少要拥有两个网络适配器:一个用于连接客户端公用网络,另一个用于连接节点对节点的专用群集网络。HCL 认证要求一个专用网络适配器。 |
• |
所有节点都必须拥有两个物理独立的局域网或虚拟局域网,分别用于公用通信和私有通信。 |
• |
如果您正在使用容错网卡或网络适配器组合,确认您正在使用最新的固件和驱动程序。向您的网络适配器制造商核实群集兼容性。 |
共享磁盘要求:
• |
一个经 HCL 认可、连接到所有计算机的外部磁盘存储单元。此存储单元将被用作群集共享磁盘。建议采用某种类型的硬件独立磁盘冗余阵列 (RAID)。 |
• |
所有共享磁盘,包括仲裁磁盘,必须实际附加到一个共享总线。 请注意: 以上要求并不适用于多数节点集 (MNS) 群集,本指南未对这类群集进行介绍。 |
• |
共享磁盘所在的控制器必须不同于系统磁盘所使用的控制器。 |
• |
建议在 RAID 配置中创建多个硬件级别的逻辑驱动器,而不是使用一个单一的逻辑磁盘,然后将其分成多个操作系统级别的分区。这不同于独立服务器通常所采用的配置。但是,它可使您在群集中拥有多个磁盘资源,还可跨节点执行“主动/主动”配置和手动负载平衡。 |
• |
一个最小 50 兆字节 (MB) 的专用磁盘,用作仲裁设备。为了得到最佳的 NTFS 文件系统性能,建议采用最小 500 MB 的磁盘分区。 |
• |
确认可以从所有的节点看到附加到共享总线的磁盘。这可以在主适配器设置级别中进行检查。请参见制造商的说明文档,以了解特定于适配器的指导说明。 |
• |
必须根据制造商的指导说明,为 SCSI 设备分配唯一的 SCSI 标识号,并正确地将其端接。请参见本文附录,以了解有关安装和端接 SCSI 设备的信息。 |
• |
所有共享磁盘必须配置为基本磁盘。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 237853 服务器群集磁盘资源不可用的动态磁盘配置 |
• |
群集共享磁盘本身不支持软件容错。 |
• |
在运行 64 位版本的 Windows Server 2003 的系统上,所有共享磁盘必须配置为主引导记录 (MBR) 磁盘。 |
• |
群集磁盘上的所有分区必须格式化为 NTFS。 |
• |
建议所有磁盘均采用硬件容错 RAID 配置。 |
• |
建议最少采用两个逻辑共享驱动器。 |
群集安装
安装概述
在安装过程中,安装某些节点时将关闭其他节点。这个步骤有助于保证附加到共享总线的磁盘上的数据不会丢失或遭到破坏。当多个节点同时尝试写入一个未受到群集软件保护的磁盘时,可能会出现数据丢失或遭到破坏的情况。与 Microsoft Windows 2000 系统不同,Windows 2003 Server 中新磁盘的默认装载方式有所变化。在 Windows 2003 中,系统不会自动装载那些引导分区不在同一总线的逻辑磁盘,也不会为其分配驱动器盘符。这有助于确保在复杂的 SAN 环境中,服务器不会装载可能属于另一台服务器的驱动器。虽然服务器不会自动装载驱动器,但是仍然建议您按照下列步骤,以确保共享磁盘不会遭到破坏。
使用下表确定在每一个步骤必须关闭的节点和存储设备。
本指南中的步骤适用于双节点群集。如果您正在安装节点数多于两个的群集,则“节点 2”列将列出其他所有节点所需的状态。
步骤 | 节点 1 | 节点 2 | 存储 | 备注 |
设置网络 |
开启 |
开启 |
关闭 |
确认共享总线上的所有存储设备均已关闭。开启所有节点。 |
设置共享磁盘 |
开启 |
关闭 |
开启 |
关闭所有节点。开启共享存储,然后开启第一个节点。 |
验证磁盘配置 |
关闭 |
开启 |
开启 |
开启第一个节点,开启第二个节点。如果需要,可以针对第三和第四个节点重复相同的步骤。 |
配置第一个节点 |
开启 |
关闭 |
开启 |
关闭所有节点;开启第一个节点。 |
配置第二个节点 |
开启 |
开启 |
开启 |
顺利配置完第一个节点后,开启第二个节点。如果需要,可以针对第三和第四个节点重复相同的步骤。 |
安装后 |
开启 |
开启 |
开启 |
所有节点都应开启。 |
在配置“群集”服务软件前,必须先执行几个步骤。这些步骤是:
• |
在每个节点上安装 Windows Server 2003 Enterprise Edition 或 Windows Server 2003 Datacenter Edition 操作系统。 |
• |
设置网络。 |
• |
设置磁盘。 |
在第一个节点上开始安装群集服务前,必须先在每一个群集节点上执行这些步骤。
要配置群集服务,您必须以一个具有所有节点管理权限的帐户登录。每个节点都必须是同一个域的成员。如果您选择将其中一个节点作为域控制器,则应在相同的子网上再设置一个域控制器,以便消除单点故障,并对该节点进行维护。
安装 Windows Server 2003 操作系统
请参见您从 Windows Server 2003 操作系统软件包中得到的文档,以在群集的每个节点上安装该系统。
配置群集服务之前,您必须在本地使用一个本地管理员组成员的域帐户登录。
请注意:如果您试图将一个节点加入一个本地管理员帐户密码为空的群集,安装将会失败。基于安全原因,Windows Server 2003 禁止使用空白的管理员密码。
设置网络
每个群集节点要求至少要有两个网络适配器用于两个或多个独立网络,以避免单点故障。其中一个网络适配器用于连接到公用网络,而另一个则用于连接到仅由群集节点组成的专用网络。拥有多个网络适配器的服务器被称为“多宿主”。由于多宿主服务器容易发生问题,因此请您务必按照本文档中描述的网络配置建议进行操作,这十分重要。
Microsoft 要求您在每个节点上具有两个经“硬件兼容性列表”(HCL) 认证并得到“Microsoft 产品支持服务”支持的“外围组件互连”(PCI) 网络适配器。通过一个静态 IP 地址,在您的生产网络上配置其中一个网络适配器,并在另一个用于进行专用群集通信的子网上,通过另一个静态 IP 地址,在一个独立的网络上配置另一个网络适配器。
服务器群集节点间的通信对于群集的顺畅运转至关重要。因此,您必须对用于群集通信的网络执行最佳配置,并遵从硬件兼容性列表上的所有要求。
专用网络适配器用于节点对节点的通信、群集状态信息和群集管理。每个节点的公用网络适配器都将群集连接到客户端所在的公用网络,并应配置为内部群集通信的后备路由。要实现这些操作,应该将群集服务的这些网络角色配置为“只用于内部群集通信”或“所有通信”。
此外,每个群集网络之间必须是独立的,如果一个网络发生故障,不会对其他网络造成影响。这意味着,两个群集网络不能具有可能导致两者同时出现故障的公用组件。例如,使用一个多端口网络适配器将节点附加到两个群集网络时,大多不能满足此要求,因为端口不是独立的。
要消除可能的流量问题,应从设置为只用于内部群集通信的网络适配器 (这种适配器也被称为核心或专用网络适配器) 中删除所有不必要的网络通信。
要验证所有的网络连接均准确无误,专用网络适配器必须位于另一个来自公用网络适配器的逻辑网络上的网络。这可以通过在双节点配置中使用跨接电缆,或者在多节点配置中使用专门的哑集线器来实现。不要对核心网络使用交换机、智能集线器或其他任何路由设备。
请注意:群集心跳不能通过路由设备进行传递,因为它们的“生存时间”(TTL) 被设定为 1。公共网络适配器只能连接到公用网络。如果您具有一个虚拟局域网 (LAN),那么节点间的等待时间必须少于 500 毫秒 (ms)。另外,在 Windows Server 2003 中,“服务器群集”中的心跳被改为多播的形式;所以,您可能需要提供一台 Madcap 服务器,以分配多播地址。其他相关信息,请参见“Microsoft 知识库”中的下列文章:307962 针对群集心跳启用多播支持
下面的图 1 简要描绘了一个四节点群集的配置。
图 1:四节点群集的连接。
查看大图。
常规网络配置:
请注意:本指南假定您正在运行默认的开始菜单。如果您使用传统的开始菜单,那么具体步骤可能稍有不同。同样,哪个网络专用哪个网络公用要依您的配线而定。在本白皮书中,第一个网络适配器 (本地连接) 被连接到公用网络,而第二个网络适配器 (本地连接 2) 被连接到专用群集网络。您的网络可能有所不同。
重命名局域网图标
建议您更改网络连接的名称,以便清楚地进行识别。例如:您可能想把本地连接 2 的名称更改为 Private。重命名将有助于您识别网络并对其正确地分配角色。
1. |
单击开始,指向控制面板,右击网络连接,然后单击打开 |
2. |
右击本地连接 2 图标。 |
3. |
单击重命名。 |
4. |
在文本框中键入 Private,然后按 ENTER 键。 |
5. |
重复步骤 1 至 3,然后将公用网络适配器重命名为 Public。 图 2:“网络连接”窗口中被重新命名的图标。 |
6. |
重命名的图标如上面的图 2 所示。关闭“网络连接”窗口。新的连接名称将出现在“群集管理器”中,并将在联机时自动复制到其他所有的群集节点。 |
在所有节点上配置绑定顺序网络
1. |
单击开始,指向控制面板,右击网络连接,然后单击打开。 |
||||||
2. |
在高级菜单上,单击高级设置。 |
||||||
3. |
在连接框中,确认您的绑定顺序如下所示,然后单击确定:
|
配置专用网络适配器
1. |
右击您的心跳适配器对应的网络连接,然后单击属性。 |
||||||
2. |
在常规选项卡上,确认仅选定了 Internet 协议 (TCP/IP) 复选框,如下面的图 3 所示。单击以清除所有其他客户端、服务和协议的复选框。 图 3:在“专用网络属性”对话框中,仅单击选定“Internet 协议”复选框。 |
||||||
3. |
如果您具有一个能够以不同速度进行传输的网络适配器,那么您应该手动指定一个速度及双工模式。不要对传输速度应用自动选择设置,因为某些适配器在特定速度时可能会丢弃一些数据包。必须根据设备卡制造商的规格说明,将所有节点上的网络适配器的速度硬性设定 (手动设定) 为相同的值。如果您不能确定您的设备卡和连接设备所支持的速度,Microsoft 建议您将同一路径上的所有设备设定为 10 兆字节每秒 (Mbps) 和半双工,如下面的图 4 所示。虽然通过心跳网络的信息量较小,但是等待时间对于通信至关重要。该配置可为可靠通信提供足够的带宽。群集中附加到相同网络的所有网络适配器必须统一设定为使用相同的双工模式、连接速度、流控制等等。联系您的适配器制造商,了解有关您的网络适配器的正确的速度和双工设置的特定信息。 图 4:为所有适配器设置速度和双工。 请注意:Microsoft 建议您不要对心跳使用任何类型的容错适配器或组合 (Teaming)。如果您需要冗余的心跳连接,可以使用多个设定为只用于内部通信的网络适配器,并在“群集”配置中定义它们的网络优先级。早期的多端口网络适配器常常存在问题,如果您使用该技术,请确认您的固件和驱动程序都属于最新的版本。联系您的网络适配器制造商,了解有关服务器群集上兼容性的信息。其他相关信息,请参见“Microsoft 知识库”中的下列文章:254101 网络适配器组合与服务器群集 |
||||||
4. |
单击“Internet 协议”(TCP/IP),然后单击“属性”。 |
||||||
5. |
在常规选项卡上,确认您所选择的静态 IP 地址与其他任何公用网络适配器不在相同的子网或网络上。建议您将专用网络适配器放置在以下任何一个专用网络地址域内:
例如,可为专用适配器使用以下 IP 地址:将节点 1 的地址设为 10.10.10.10,将节点 2 的地址设为 10.10.10.11,同时将子网掩码设为 255.0.0.0,如下面的图 5 所示。确认该 IP 地址方案与应用于公用网络的 IP 地址方案完全不同。 请注意:有关专用网络的有效 IP 寻址的其他信息,请参见“Microsoft 知识库”中的以下文章:142863 专用网络的有效 IP 寻址 图 5:适用于专用适配器的 IP 地址示例。 |
||||||
6. |
确认未在默认网关框或使用下列 DNS 服务器地址下定义任何值。 |
||||||
7. |
单击高级按钮。 |
||||||
8. |
在 DNS 选项卡上,确认未定义任何值。同时确保清除了在 DNS 中注册此连接的地址和在 DNS 注册中使用此连接的 DNS 后缀复选框。 |
||||||
9. |
在 WINS 选项卡上,确认未定义任何值。单击禁用 TCP/IP 上的 NetBIOS,如下面的图 6 所示。 图 6:确认未在 WINS 选项卡上定义任何值。 |
||||||
10. |
关闭该对话框时,您可能会收到以下提示:此连接具有一个空白的主 WINS 地址。您想继续吗?如果您收到了该提示,请单击是 |
||||||
11. |
在群集中的所有其他节点上,通过不同静态 IP 地址完成步骤 1 至 10。 |
配置公用网络适配器
请注意:如果 IP 地址是通过 DHCP 获取的,那么如果不能访问 DHCP 服务器,则可能无法接入群集节点。由于这个原因,服务器群集上的所有接口均要求静态 IP 地址。请记住,群集服务只能识别每个子网上的一个网络接口。如果您需要 Windows Server 2003 中 TCP/IP 寻址的协助,请参见“联机帮助”。
验证连通性和名称解析
要验证专用和公用网络是否能够正确地通信,请自每个节点 ping 所有的 IP 地址。您应当能够在本地和远程节点上 ping 通所有的 IP 地址。
要验证名称解析,从客户端 ping 每一个节点的机器名称 (非 IP 地址)。应当只能返回公用网络的 IP 地址。您也许还想尝试通过 PING a 命令,反向查询 IP 地址。
验证域成员
群集中的所有节点必须是同一个域的成员,并可以访问域控制器和 DNS 服务器。可以将其配置为成员服务器或域控制器。与群集一样,您至少应该在相同的网络区域具有一个域控制器。基于高可用性。另一个域控制器也应该可用于消除单点故障。在本指南中,所有的节点都被设定为成员服务器。
在某些实例中,节点可能部署于并未预先配置 Microsoft Windows NT 4.0 域控制器或 Windows Server 2003 域控制器的环境中。在这种情况下至少要求其中有一个群集节点被设定为域控制器。但是,在双节点服务器群集中,如果其中有一个节点是域控制器,那么另一个节点也必须是一个域控制器。在四节点群集实施过程中,没有必要将全部四个节点都设定为域控制器。然而,当遵循一个“最佳实践”模型并至少具有一个后备域控制器时,余下的三个节点中至少应该有一个被设定为域控制器。在设定群集服务之前,必须使用 DCPromo 工具将其中一个节点提升为域控制器。
如果另一个支持动态更新和/或 SRV 记录的 DNS 服务器不可用,则 Windows Server 2003 中的 DNS 相关设置还要求每一个域控制器节点同时必须是 DNS 服务器 (建议采用 Active directory 集成区域)。
在将群集节点部署为域控制器时,应该考虑以下问题:
• |
如果双节点群集中有一个群集节点是域控制器,另一个节点也必须是域控制器 |
• |
运行域控制器需要一定的开销。一个闲置的域控制器通常会使用 130 到 140 MB 的 RAM,其中包括维持群集服务运行所需的内存。复制也会增加网络流量,因为这些域控制器必须与域中和域间的其他域控制器共同进行复制。 |
• |
如果群集节点是唯一的域控制器,那么每个节点必须同时是 DNS 服务器。它们应当相互指向对方以用于主 DNS 解析,以及指向它们自身以用于辅助解析。 |
• |
森林/域中的第一个域控制器将承担所有的“操作主控角色”。您可以将这些角色重新分配给任何节点。但是,如果有一个节点出了故障,该节点所承担的“操作主控角色”将不再可用。因此,建议您不要在任何群集节点上运行“操作主控角色”。其中包括“架构主控”、“域命名主控”、“相关 ID 主控”、“PDC 仿真主控”和“基础结构主控”。不能对这些功能进行群集处理来提供高可用性和故障转移能力。 |
• |
由于资源限制,在节点同时是域控制器的情况下,对 Microsoft SQL Server 或 Microsoft Exchange Server 等其他应用程序进行群集处理可能无法达到最佳效果。在部署前,该配置必须在实验室环境中进行全面的测试 |
由于创建群集节点域控制器所涉及的复杂性和开销,建议所有节点都应作为成员服务器。
设置群集用户帐户
群集服务需要一个域用户帐户,该帐户应为每个可运行群集服务的节点上的“本地管理员”组成员。因为安装需要用户名和密码,所以该用户帐户必须在配置群集服务前予以创建。该用户帐户只能专门用于运行群集服务,而不能属于个人。
请注意:群集服务帐户不必是“域管理员”组的成员。基于安全原因,建议不要授予群集服务帐户域管理员的权利。
群集服务帐户需要下列权利,以在群集的所有节点上正常工作。“群集配置向导”自动授予以下权利:
• |
充当操作系统的一部分 |
• |
调整某个过程的内存配额 |
• |
备份文件和目录 |
• |
增加计划优先级 |
• |
作为服务登录 |
• |
还原文件和目录 |
其他相关信息,请参见“Microsoft知识库”中的以下文章:
269229 如何手动重新创建群集服务帐户
设置群集用户帐户
1. |
单击开始,指向所有程序,指向管理工具,然后单击 Active Directory 用户和计算机。 |
2. |
如果域还未展开,单击加号 (+) 将其展开。 |
3. |
右击用户,指向新建,然后单击用户。 |
4. |
键入群集名称,如下面的图 7 所示,然后单击下一步。 图 7:键入群集名称。 |
5. |
将密码设置设定为用户不能更改密码和密码永不过期。单击下一步,然后单击完成创建该用户。 请注意:如果您的管理安全策略不允许使用永不过期的密码,您必须在密码到期前,在每个节点上重续密码并更新群集服务配置。其他相关信息,请参见“Microsoft 知识库”中的下列文章:305813 如何更改群集服务帐户密码 |
6. |
在“Active Directory 用户和计算机”管理单元的左侧窗格中,右击群集,然后在快捷菜单上单击属性。 |
7. |
单击将成员添加到组。 |
8. |
单击管理员,然后单击确定。这将给予新用户帐户在该计算机上的管理特权。 |
9. |
退出“Active Directory 用户和计算机”管理单元。 |
设置共享磁盘
警告:为了避免破坏群集磁盘,在其他节点上启动操作系统前,确认至少在一个节点上安装、配置并运行了 Windows Server 2003 和群集服务。在完成群集服务配置之前,所开启的节点数不要超过一个,这一点至关重要。
在继续操作前,关闭所有节点。开启共享存储设备,然后开启节点 1。
关于仲裁磁盘
仲裁磁盘用于存储群集配置数据库检查点和日志文件,日志文件可协助管理群集和维护一致性。建议您按照以下仲裁磁盘步骤进行设置:
• |
创建一个最小 50 MB 的逻辑驱动器用作仲裁磁盘,对于 NTFS,最佳的大小为 500 MB。 |
• |
专门划出一个单独的磁盘作为仲裁资源。 |
重要:仲裁磁盘故障可能导致整个群集失效;所以,强烈建议您使用硬件 RAID 阵列上的一个卷。除了进行群集管理外,不要使用仲裁磁盘执行其他任务。
仲裁资源在群集运作中扮演着关键的角色。在每个群集中,都有一个单一资源被指定为仲裁资源。仲裁资源可以是具备下列功能的任何“物理磁盘”资源:
• |
将群集注册表复制到服务器群集中的其他节点上。默认情况下,群集注册表存储在每个节点上的以下位置:%SystemRoot%\Cluster\Clusdb。而后,群集注册表被复制到仲裁驱动器的 MSCS\Chkxxx.tmp 文件中。这些文件互为副本。MSCS\Quolog.log 文件是一个事务处理日志,用于维护对检查点文件执行的所有更改记录。这意味着,脱机节点可以在重新加入群集时追加这些更改。 |
• |
如果群集节点间失去了通信,将启动质询响应协议以防止出现“分离”现象的发生。在这种情况下,仲裁磁盘资源的所有者将变成群集及所有资源的唯一所有者。所有者随之为客户端提供资源。当具有仲裁磁盘的节点运作不正常时,其他的正常节点将通过仲裁获得设备的所有权。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 309186 群集服务如何在共享总线上获得磁盘的所有权 |
在群集服务安装过程中,您必须为仲裁磁盘提供驱动器盘符。常用的标准盘符为 Q,本例中亦采用 Q 盘符。
配置共享磁盘
1. |
确认仅开启了一个节点。 |
2. |
右击我的电脑,单击管理,然后展开存储。 |
3. |
双击磁盘管理。 |
4. |
如果您连接了一个新的驱动器,将自动开启“写入签名和更新磁盘向导”。如果出现该向导,单击下一步,完成向导的各个步骤。 请注意:该向导自动将磁盘设为动态。要将磁盘复位到基本状态,右击磁盘 n (n 在此处指您正在设定的磁盘),然后单击还原基本磁盘。 |
5. |
右击未分配的磁盘空间. |
6. |
将启动“新建分区向导”。单击下一步。 |
7. |
将启动“新建分区向导”。单击下一步。 |
8. |
选择主分区的分区类型。单击下一步。 |
9. |
默认将分区大小设为最大。单击下一步。(建议采用多个逻辑磁盘,而不是在一个磁盘上采用多个分区。) |
10. |
使用下拉框更改驱动器盘符。使用在字母表上比默认列举的字母更靠后的驱动器盘符。通常,驱动器盘符 Q 可以用于仲裁磁盘,而 R、S 等字母则用于数据磁盘。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 318534 在服务器群集上分配驱动器盘符的最佳实践 请注意:如果您正在计划使用卷装载点,则不要对磁盘分配驱动器盘符。其他相关信息,请参见“Microsoft 知识库”中的下列文章:280297 如何在群集服务器上配置卷装载点 |
11. |
使用 NTFS 格式化分区。在卷标框中,键入该磁盘的名称。例如,驱动器 Q,如下面的图 8 所示。为共享磁盘分配驱动器卷标至关重要,因为在还原磁盘时这会大大减少故障排除时间。 图 8:为共享磁盘分配驱动器卷标至关重要。 |
如果您正在安装 64 位版本的 Windows Server 2003,确认所有的磁盘均格式化为 MBR。不支持将“全局分区表”(GPT) 作为群集磁盘。其他相关信息,请参见“Microsoft 知识库”中的下列文章:
284134 服务器群集不支持 GPT 共享磁盘
确认所有的共享磁盘均格式化为 NTFS 并指定为 MBR Basic。
验证磁盘访问与功能
1. |
启动 Windows Explorer。 |
2. |
右击一个共享磁盘 (例如,驱动器 Q:\),单击新建,然后单击文本文档。 |
3. |
确认您可以顺利写入磁盘,并创建了文件。 |
4. |
选择所创建的文件,然后按 Del 键,将其从群集磁盘中删除。 |
5. |
对所有群集磁盘重复步骤 1 至 4,确认可以从第一个节点正确地访问它们。 |
6. |
关闭第一个节点,开启第二个节点,并重复步骤 1 至 4,验证磁盘访问和功能。分配与驱动器卷标相匹配的驱动器盘符。对任何其他节点重复相同的步骤。确认所有节点都可以从磁盘读取和写入,关闭除第一个节点以外的所有节点,然后继续本白皮书。 |
配置群集服务
您必须在安装的第一个阶段提供所有初始配置信息。该步骤可通过“群集配置向导”来完成。
如下方流程图所示,Form (创建一个新群集) 和 Join (添加节点) 所采取的路径有所不同,但是它们共有一些相同的设置页面。即“凭证登录”、“分析”以及“重新分析并启动服务”。而在下列页面上则有少许不同:“欢迎”、“选择计算机”和“群集服务帐户”。在本课的下面两个部分中,您将分步完成反映所有这些配置路径的向导页面。当您完成了所有的步骤,本白皮书将在第三部分中详细描述“分析”和“重新分析并启动服务”页面,以及这些屏幕所提供的信息的具体含义。
请注意:在节点 1 上进行群集服务配置的过程中,您必须关闭所有其他节点。开启所有共享存储设备。
配置第一个节点
1. |
依次单击开始、所有程序和管理工具,然后单击群集管理器。 |
2. |
当出现“打开到群集的连接”提示时,在操作下拉列表中,单击创建新群集,如下面的图 9 所示。 图 9:“操作”下拉列表。 |
3. |
确认您具有配置群集所必需的前提条件,如下面的图 10 所示。单击下一步。 图 10:前提条件列表属于“欢迎使用新建服务器群集向导”页面的一部分。 |
4. |
键入群集的唯一 NetBIOS 名称 (最多 15 个字符),然后单击下一步。在下面的图 11 所示的例子中,群集被命名为 MyCluster。建议遵守 DNS 命名规则。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 163409 NetBIOS 后缀 (NetBIOS 名称的第 16 个字符) 254680 DNS 名称空间规划 图 11:建议在命名群集时遵守 DNS 命名规则。 |
5. |
如果您在本地使用一个不属于具有本地管理特权的域帐户的帐户登录,向导将提示您指定一个帐户。这不是启动群集服务所用的帐户。 请注意: 如果您具有正确的凭证,步骤 5 所提到的提示,如图 12 所示,可能不会出现。 图 12:“新建服务器群集向导”提示您指定一个帐户。 |
6. |
由于可能对群集进行远程配置,因此您必须确认或键入将要作为第一个节点创建群集的服务器的名称,如下面的图 13 所示。单击下一步。 图 13:选择将要作为群集中第一个节点的计算机名称。 请注意:“安装”向导可以验证所有的节点是否都可以看到共享磁盘。在复杂的存储区域网络中,磁盘的目标识别符 (TID) 有时可能会不同,而且“安装”程序可能错误地检测到磁盘配置对于“安装”无效。要解决这个问题,您可以单击高级按钮,然后单击高级 (最小) 配置。其他相关信息,请参见“Microsoft 知识库”中的下列文章:331801 在您添加节点时群集安装程序可能不工作 |
7. |
下面的图 14 显示“安装”程序正在分析节点,查找可能导致安装出现问题的硬件或软件问题。检查所有警告或错误信息。您还可以单击详细信息按钮,了解有关每个警告或提示的详细信息。 图 14:“安装”程序正在分析节点,查找可能存在的硬件或软件问题。 |
8. |
键入唯一的群集 IP 地址 (在本示例中为:172.26.204.10),然后单击下一步。 如下面的图 15 所示,“新建服务器群集向导”通过使用子网掩码选择正确的网络,自动与其中一个公用网络关联群集 IP 地址。群集 IP 地址只能用于管理,而不能用于客户端连接。 图 15:“新建服务器群集向导”自动与其中一个公用网络关联群集 IP 地址。 |
9. |
键入在预安装时创建的群集服务帐户的用户名和密码。(在下面图 16 所示的例子中,用户名为:Cluster)。在域下拉列表中选择域名,然后单击下一步。 此时,群集配置向导将验证用户帐户和密码。 图 16:向导提示您提供在预安装时所创建的帐户。 |
10. |
检查摘要页面,如下面的图 17 所示,确认所有将用于创建群集的信息均准确无误。如果需要,您可以使用仲裁按钮,更改由默认自动选择的磁盘指定的仲裁磁盘。 本屏幕上所显示的摘要信息可用于在出现灾难恢复状况时,重新配置群集。建议您保存并打印一份硬拷贝,与服务器上的更改管理日志保持一致。 请注意:仲裁按钮也可用于指定一个多数节点集 (MNS) 仲裁模型。在您创建 MNS 群集时,这是主要的配置区别之一。 图 17:“目标群集配置”页面。 |
11. |
检查所有在群集创建过程中遇到的警告或错误。具体操作是单击加号查看更多信息,然后单击下一步。出现在“创建群集”页面中的警告和错误如图 18 所示。 图 18:出现在“创建群集”页面上的警告和错误。 |
12. |
单击完成结束安装。下面的图 19 显示最终的步骤。 图 19:设置新服务器群集的最终步骤。 请注意:要查看详细的摘要,单击查看日志按钮,或者查看存储在以下位置:%SystemRoot%\System32\LogFiles\Cluster\ClCfgSrv.Log 的文本文件。 |
验证群集安装
使用“群集管理器”(CluAdmin.exe),在节点 1 上验证群集服务安装。
验证群集安装
1. |
依次单击开始、所有程序和管理工具,然后单击群集管理器。 |
2. |
确认所有的资源均顺利地实现了联机,如下面的图 20 所示。 图 20:“群集管理器”验证所有的资源均顺利地实现联机。 |
请注意: 原则上,不要将任何东西放到群集组中,不要从群集组中取出任何东西,也不要使用群集组中的任何东西执行群集管理以外的操作。
配置第二个节点
在第二个节点上安装群集服务所需的时间要比在第一个节点上安装所需的时间少。“安装”程序基于第一个节点的配置,在第二个节点上配置群集服务网络设置。与此同时,您还可以通过远程操作为群集添加多个节点。
请注意:在这部分的练习中,开启节点 1 和所有的共享磁盘。然后开启所有其他节点。这时,群集服务将控制对共享磁盘的访问权限,以便杜绝任何可能破坏卷的机会。
1. |
在节点 1 上打开群集管理器。 |
2. |
单击文件,单击新建,然后单击节点。 |
3. |
将启动“添加群集计算机向导”。单击下一步。 |
4. |
如果您没有使用正确的凭证进行登录,将要求您指定一个对群集中所有节点具有管理权利的域帐户。 |
5. |
输入您要将其添加到群集的节点的机器名称。单击添加。重复该步骤,如下面的图 21 所示,添加您想要的其他节点。当所有的节点均添加完毕后,单击下一步。 图 21:向群集添加节点。 |
6. |
“安装”向导将对所有节点执行分析,以确认它们得到了正确的配置。 |
7. |
键入用于启动群集服务的帐户密码。 |
8. |
检查显示的摘要信息,确认其准确性。当其他节点加入到群集中时,此摘要信息将用于对这些节点进行配置。 |
9. |
检查群集创建过程中遇到的所有警告或错误,然后单击下一步。 |
10. |
单击完成结束安装。 |
安装后配置
心跳配置
现在,每个节点上的网络都已得到了正确的配置,而且群集服务也已配置完毕,这时您需要配置网络角色,以定义其在群集中的功能。此处是一份“群集管理器”中网络配置选项的列表:
• |
为群集应用启用:如果选定了该复选框,群集服务将使用该网络。默认对所有网络选定该复选框。 |
• |
仅用于客户端访问 (公用网络):如果您想让群集服务仅使用该网络适配器与其他客户端进行外部通信,则可选择该选项。该网络适配器将不进行节点对节点的通信。 |
• |
仅用于内部群集通信 (专用网络):如果您想让群集仅使用该网络进行节点对节点的通信,则可选择该选项。 |
• |
所有通信 (混合网络):如果您想让群集服务使用该网络适配器进行节点对节点通信和外部客户端通信,则可选择该选项。默认对所有网络选定该选项。 |
本白皮书假定仅使用两个网络。它解释如何将这两个网络分别作为混合网络和专用网络进行配置。这是最常见的配置。如果您具有可用的资源,建议使用两个专门的冗余网络用于内部群集通信。
配置心跳
1. |
启动“群集管理器”。 |
2. |
在左侧窗格中,单击群集配置,单击网络,右击专用,然后单击属性。 |
3. |
单击仅用于内部群集通信 (专用网络),如下面的图 22 所示。 图 22:使用“群集管理器”配置心跳。 |
4. |
单击确定。 |
5. |
右击公用,然后单击属性 (如下面的图 23 所示)。 |
6. |
单击选定为群集应用启用该网络复选框。 |
7. |
单击所有通信 (混合网络),然后单击确定。 图 23:“公用属性”对话框。 |
心跳适配器优先化
配置完群集服务如何应用网络适配器的角色后,下一步是对内部群集通信应用进行优先排序。这仅适用于两个或多个被配置为节点对节点通信的网络。屏幕右边的优先级箭头指定了群集服务使用各个网络适配器在节点间进行通信的先后顺序。群集服务总是尝试使用列于首位的网络适配器进行节点间的远程过程调用 (RPC) 通信。只有当群集服务无法使用第一个网络适配器进行通信时,才会使用列表上的下一个网络适配器。
1. |
启动“群集管理器”。 |
2. |
在左窗格中,右击群集名称 (位于左上角),然后单击属性。 |
3. |
单击网络优先级选项卡,如下面的图 24 所示。 图 24:“群集管理器”中的“网络优先级”选项卡。 |
4. |
确认专用网络列于最顶部。使用上移或下移按钮,更改优先顺序。 |
5. |
单击确定。 |
配置群集磁盘
• |
启动“群集管理器”,右击您想从群集删除的任何磁盘,然后单击删除。 |
请注意:默认状态下,所有磁盘并不在相同的总线上,因为系统磁盘将为它们创建“物理磁盘资源”,并将其群集。因此,如果节点具有多条总线,可能列出的某些磁盘将无法用作共享存储,例如,内部 SCSI 驱动器。应该从群集配置中删除这些磁盘。如果您计划对某些磁盘实施“卷装载”点,则可能要删除这些磁盘的当前磁盘资源,删除驱动器盘符,然后创建一个未分配驱动器盘符的新的磁盘资源。
仲裁磁盘配置
“群集配置向导”自动选择将作为仲裁设备的驱动器。并将使用 50 MB 以上的最小分区。您可能要把自动选择的磁盘更改为您自己指定的仲裁磁盘。
配置仲裁磁盘
1. |
启动“群集管理器”(CluAdmin.exe)。 |
2. |
右击位于左上角的群集名称,然后单击属性。 |
3. |
单击仲裁选项卡。 |
4. |
在仲裁资源列表框中,选择一个不同的磁盘资源。在下面的图 25 中,仲裁资源列表框中选定的是“磁盘 Q”。 图 25:“仲裁资源”列表框。 |
5. |
如果磁盘具有的分区不止一个,单击您要在其中存储群集指定数据的分区,然后单击确定。 |
其他相关信息,请参见“Microsoft 知识库”中的下列文章:
280353 如何更改仲裁磁盘指定
创建一个延迟启动
当所有的群集节点均同时启动并尝试附加到仲裁资源时,群集服务可能无法启动。例如,在发生电源故障后,同时对所有节点恢复电力时,可能出现这种情况。要避免这类情况的发生,可以增加或减少显示操作系统列表的时间设置。要找到该设置,单击开始,指向我的电脑并右击我的电脑,然后单击属性。单击高级选项卡,然后在启动和故障恢复框中,单击设置。
测试安装
在“安装”程序结束后,有几种可供验证群集服务安装的方法。其中包括:
• |
群集管理器:如果仅完成了节点 1 的安装,启动“群集管理器”,然后尝试连接到群集。如果已安装了第二个节点 2,在任意一个节点上启动“群集管理器”,然后确认第二个群集显示在列表上。 |
• |
“服务”小程序: 使用服务管理单元确认群集服务已显示在列表上并已启动。 |
• |
事件日志:使用“事件查看器”检查系统日志中的 ClusSvc 条目。您会看到有关确认群集服务已经顺利形成或加入一个群集的条目。 |
• |
群集服务注册表项:确认群集服务安装程序已将正确的项写入注册表。您可以在 HKEY_LOCAL_MACHINE\Cluster 下找到许多注册表设置 |
• |
单击开始,单击运行,然后键入“虚拟服务器”的名称。确认您可以连接并看到资源。 |
测试故障转移
验证资源可以执行故障转移
1. |
依次单击开始、程序和管理工具,然后单击群集管理器,如下面的图 26 所示。 图 26:“群集管理器”窗口。 |
2. |
右击磁盘组 1 组,然后单击移动组。该组及其所有资源将转移到另一个节点。稍后,磁盘 F:G:将在第二个节点上实现联机。在窗口中观察该转移。退出“群集管理器”。 |
恭喜!您已经完成了所有节点上的群集服务配置。服务器群集已经可以完全正常地运作了。您现在可以准备安装群集资源,如,文件共享、打印机后台处理程序、诸如分布式事务协调器、DHCP、WINS 等群集敏感服务、或者诸如 Exchange Server 或 SQL Server 等群集敏感程序。
附录
高级测试
现在,您已经配置好了您的群集并验证了基本的功能和故障转移,您可能想执行一系列的故障情境测试,来演示预期的结果,并确保群集在发生故障时会正确地进行响应。并不是在每一次实施时都需要进行这种程度的测试,但是如果您刚开始接触群集技术,而且不熟悉群集的响应方式,或者您正在自己的环境中实施一个新的硬件平台,这将有助于深入了解集群管理。所列出的预期结果是针对结合默认设置的干净群集配置,并未考虑任何用户自定义的故障转移逻辑。这不是一个包含所有测试的完整列表,而顺利完成这些测试并不能认为已经得到了“许可”或准备好进行生产运作。这只是一个关于某些可执行的测试的示范列表。其他相关信息,请参见“Microsoft 知识库”中的下列文章:
197047 Microsoft 群集服务器上的故障转移/故障恢复策略
测试:启动“群集管理器”,右击一个资源,然后单击启动故障。该资源将进入故障状态,然后将重新启动并在同一节点上回到联机状态。
预期结果:资源将在相同的节点上返回联机状态
测试:在相同的资源上,再执行三次上述启动故障测试。在第四次故障时,资源将对群集中的另一个节点执行故障转移。
预期结果:资源将针对群集中的另一个节点实施故障转移
测试:将所有资源转移到一个节点上。启动“计算机管理”,然后单击服务和应用程序下方的服务。停止群集服务。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。
预期结果:资源将针对群集中的另一个节点实施故障转移
测试:将所有资源转移到一个节点上。在该节点上,单击启动,然后单击关闭。这将关闭该节点。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。
预期结果:资源将针对群集中的另一个节点实施故障转移
测试:将所有资源转移到一个节点上,然后按服务器前方的电源按钮将其关闭。如果您有一台符合 ACPI (高级配置和电源接口) 标准的服务器,该服务器将执行“紧急关闭”功能进行关闭。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。有关“紧急关闭”的其他信息,请参见“Microsoft 知识库”中的下列文章:
325343 操作指南:在 Windows Server 2003 中执行紧急关闭
297150 ACPI 计算机上的电源按钮可能强制执行紧急关闭
预期结果:资源将针对群集中的另一个节点实施故障转移
警告:执行“紧急关闭”测试可能导致数据遭破坏和丢失。不要在生产服务器上执行该测试
测试:将所有资源转移到一个节点上,然后拔掉服务器的电源线模仿一个硬故障。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态
预期结果:资源将针对群集中的另一个节点实施故障转移
警告:执行硬故障测试测试可能导致数据遭破坏和丢失。这是一个极端测试。确认您已备份了所有关键数据,然后在您自己的磁盘上执行该测试。不要在生产服务器上执行该测试
测试:将所有资源转移到一个节点上,然后拔掉该节点的公用网络电缆。IP 地址资源将失效,组将针对群集中的另一个节点执行故障转移。其他相关信息,请参见“Microsoft 知识库”中的下列文章:
286342 Windows Server 2003 群集中的网络故障检测与恢复
预期结果:资源将针对群集中的另一个节点实施故障转移
测试:拔掉专用心跳网络的网络电缆。心跳流量将针对公用网络执行故障转移,同时不会执行其他故障转移。如果发生了其他故障转移,请参见本文档前面有关“配置专用网络适配器”的部分
预期结果:不会进行其他任何故障转移或资源故障转移
SCSI 驱动器安装
本附录提供一套针对 SCSI 驱动器安装的一般性指导说明。如果 SCSI 硬盘供应商的指导说明与此处的指导说明相冲突,请遵从供应商所提供的指导说明。
硬件要求中所列的 SCSI 总线必须在安装群集服务器之前予以配置。配置涉及:
• |
SCSI 设备。 |
• |
SCSI 控制器和硬盘,以保证可以在共享 SCSI 总线上正常运行。 |
• |
正确端接总线。共享 SCSI 总线必须在总线的每个终端上均具有一个端接器。群集的各个节点间可能具有多条共享 SCSI 总线。 |
除了以下几页信息外,请参见您的 SCSI 设备制造商的说明文档,或者可以向美国国家标准协会 (ANSI) 索取 SCSI 规格说明。 ANSI 网站 包含一个可用于搜索 SCSI 规格说明的目录。
配置 SCSI 设备
共享 SCSI 总线上的每个设备都必须有一个唯一的 SCSI 标识号 (ID)。由于多数 SCSI 控制器默认为 SCSI ID 7,因此配置共享 SCSI 总线包括将控制器上的 SCSI ID 号码更改为另一个号码,比如:SCSI ID 6。如果共享 SCSI 总线上的磁盘不止一个,每个磁盘都必须具有一个唯一的 SCSI ID 号码。
端接共享 SCSI 总线
有几种端接共享 SCSI 总线的方法,其中包括:
• |
SCSI 控制器 SCSI 控制器具有可用于端接总线的内部软端接,但是不推荐对群集服务器使用该方法。使用该配置,如果一个节点被关闭,则 SCSI 总线将不能够正确端接,且不能正常地运作。 |
• |
存储盒 存储盒也具有内部端接,如果存储盒位于 SCSI 总线的末端,其内部端接可用于端接 SCSI 总线。应该将其关闭。 |
• |
Y 电缆 Y 电缆可用于连接位于 SCSI 总线末端的设备。外部活动端接器随后可以附加到 Y 电缆的一个分支,以便端接 SCSI 总线。该端接方法要求禁用或移除设备可能具有的任何内部端接器。 |
图 27 说明了 SCSI 群集的正确物理连接方式。
图 27:SCSI 群集硬件配置示意图。
查看大图。
请注意:对于任何位于共享总线末端的设备,都必须禁用其内部端接。Y 电缆和活动端接连接器均是推荐的端接方法,因为即使节点未联机时,它们也能提供端接。
存储区域网络的考虑事项
在 Windows Server 2003 服务器群集中,有两种基于光纤通道的存储支持方法:仲裁环和交换架构。
重要: 在对这两类光纤通道实施进行评估时,请先阅读供应商的文档,并确定您了解每种实施的指定特性和限制。
虽然光纤通道这一术语暗示了光纤技术的应用,但是也允许使用铜制同轴电缆进行互连。
仲裁环 (FC-AL)
光纤通道仲裁环 (FC-AL) 是一套相互连接形成一个单一环路的节点和设备集合。FC-AL 提供了一个能将多达 126 个设备连接形成为一个单一网络的经济方法。通过 SCSI,结合集线器配置的 FC-AL 服务器群集最多可支持两个节点。图 28 为 FC-AL 的示意图。
图 28:FC-AL 连接
FC-AL 以相对静态的配置为双节点和少量设备提供解决方案。环路上的所有设备共享介质,而且从一个设备传输到另一个设备的任何数据包都必须通过所有中间设备。
如果一个双节点服务器群集可以满足您对可用性的需求,那么 FC-AL 部署将具有以下几个优点:
• |
成本费用相对较低。 |
• |
环路可得到扩展以增加存储 (虽然不能添加节点)。 |
• |
对于光纤通道供应商来说,这种环路很易于开发。 |
环路的缺点是难以在组织中进行部署。由于环路上的每个设备均共享同一个介质,因此群集中的整体带宽变窄了。有些组织还可能受到 126 个设备上限的限制。
交换架构 (FC-SW)
对于任何超过两个节点的群集,光纤通道交换架构 (FC-SW) 是唯一受支持的存储技术。在 FC-SW 中,设备在使用光纤通道交换器的多对多拓扑结构中进行连接 (如图 29 所示)。
图 29:FC-SW 连接
查看大图。
当一个节点或设备同 FC-SW 中的另一个节点或设备进行通信时,通信源和通信目标对象建立起一个点对点连接 (类似一个虚拟电路),并直接进行相互通信。架构自身将通信源路由至通信目标对象。在 FC-SW 中,并不共享介质。任何设备都可以同其他任何设备进行通信,并以最高总线速度实现通信。这是一个完全可伸缩的企业解决方案,因此强烈建议与服务器群集一起部署。
FC-SW 是 SAN 中所采用的主要技术。FC-SW 的其他优点有易于部署、可支持数百万个设备,以及提供故障隔离和改换路由的交换机。另外,不存在像 FC-AL 中的共享介质,允许更快地进行通信。但是,要知道 FC-SW 对于供应商来说难以开发,而且交换机的价格很昂贵。供应商还必须考虑来自不同供应商或制造商的组件间的互操作性问题。
结合服务器群集使用 SAN
对于任何大型群集部署,建议您使用存储区域网络 (SAN) 进行数据存储。虽然较小的 SCSI 和独立光纤通道存储设备可以随服务器群集一起运作,但是 SAN 可以提供超强的容错能力。
SAN 是一套连接到常规通信和数据传输基础结构 (在 Windows Server 2003 群集中为 FC-SW) 的互连设备 (比如:磁盘和磁带) 和服务器。SAN 允许多个服务器接入存储池,同时任何服务器都可以在其中潜在地访问任何存储单元。
本部分中的信息提供了一个概述,可帮助您在 Windows Server 2003 群集中使用 SAN 技术。有关在 SAN 上部署服务器群集的其他信息,请参见 “Web 资源”页面 中的“Windows 群集:存储区域网络”链接 (位于http://www.microsoft.com/windows/reskits/webresources/ )。
请注意:提供 SAN 架构组件和软件管理工具的供应商具有一系列的工具,可用于构建、配置、监控和管理 SAN 架构。请联系您的 SAN 供应商,以了解您的特殊 SAN 解决方案的详细信息。
SCSI 复位
Windows 服务器群集的早期版本假定对于共享磁盘的所有通信应作为一个独立的 SCSI 总线。该做法略具破坏性,并且没有利用光纤通道的高级特性来提高仲裁性能和减少通信中断。
Windows Server 2003 中的一个关键改进是群集服务发出一个命令用以打断一个 RESERVATION,而 StorPort 驱动程序可以针对光纤通道拓扑结构上的磁盘执行目标或设备复位。在 Windows 2000 服务器群集中,整个总线范围的 SCSI RESET (复位) 得到了发布。这导致总线上的所有设备被断开连接。发布 SCSI RESET 时,很多时间被花在复位可能无需进行复位的设备上,比如,CHALLENGER 节点可能已经拥有的磁盘。
Windows 2003 中的复位按照以下顺序进行:
1. |
1. 目标逻辑单元号码 (LUN) |
2. |
2. 目标 SCSI ID |
3. |
3. 整个总线范围的 SCSI RESET |
请注意: 目标复位需要主机总线适配器 (HBA) 驱动程序中的功能。驱动程序必须是针对 StorPort 而不是 SCSIPort 编写的。使用 SCSIPort 的驱动程序将如同在 Windows 2000 中使用 Challenge 和 Defense 一样。请联系 HBA 制造商,以确定其是否支持 StorPort。
SCSI 命令
群集服务使用下列 SCSI 命令:
• |
SCSI reserve:该命令由主机总线适配器或控制器发出,用于维护 SCSI 设备的所有权。除了最初对其进行保留的主机总线适配器 (即发起者) 发出的命令外,被保留的设备拒绝所有来自其他主机总线适配器的命令。如果发出了一个总线范围的 SCSI 复位命令,保留将丢失。 |
• |
SCSI release:该命令由具有所有权的主机总线适配器发出;释放 SCSI 设备,以便让其他主机总线适配器对其进行保留。 |
• |
SCSI reset:该命令将中断目标设备上的保留。有时该命令大体上指 "bus reset"。 |
相同的控制代码也可用于“光纤通道”。下同这篇合作伙伴的文章中定义了这些参数:
309186 群集服务如何获得共享总线上磁盘的所有权
317162 支持的光纤通道配置
以下部分概述一些直接影响服务器群集部署的 SAN 概念。
HBA
主机总线适配器 (HBA) 是将群集节点连接到 SAN 的接口卡,其连接方法类似于网络适配器将服务器连接到典型的 Ethernet 网络的方式。但是,HBA 并网络适配器更加不容易配置 (除非 HBA 由 SAN 供应商预配置)。所有节点中的 HBA 必须是完全一致的,而且必须采用相同的驱动程序和固件版本。
分区和 LUN 屏蔽
分区和 LUN 屏蔽是 SAN 部署的基础,尤其是当它们与 Windows Server 2003 群集部署相关时。
分区
许多设备和节点都可以附加到 SAN。由于数据存储在一个单一的 cloud 或存储实体中,控制哪些主机可以接入特定设备是很重要的。区域划分允许管理员在逻辑卷中对设备进行分区,从而将设备保留在一个卷中以便为服务器群集所用。这意味着,逻辑存储卷中群集节点和设备间的所有交互都被隔离在区域边界内;而其他 SAN 的非群集成员则不会受群集行为的影响。
图 30 对两个 SAN 区域进行了逻辑描述 (A 区域和 B 区域),每个区域均包含一个存储控制器 (分别为 S1 和 S2)。
图 30:分区
查看大图。
在该实施中,节点 A 和节点 B 可以从存储控制器 S1 访问数据,但节点 C 不可以。节点 C 可以从存储控制器 S2 访问数据。
分区需要在硬件层次进行实施 (结合控制器或交换机),而不能通过软件来实现。主要的原因是:分区也是一个针对基于 SAN 的群集的安全机制,因为未经授权的服务器无法访问区域内的设备 (访问控制由架构中的交换机来执行,因此主机适配器无法访问未经配置的设备)。如果通过软件形式进行分区,如果软件组件出现故障,群集将无法得到安全保障。
除了提供群集安全性外,分区还对给定 SAN 环境中的流量进行了限制。端口间的流量只被路由到位于相同区域的架构段中。
LUN 屏蔽
LUN 是 SAN 中定义的逻辑磁盘。服务器群集发现 LUN 后会将其认作物理磁盘。LUN 屏蔽是在控制器层面执行的,它允许您定义 LUN 与群集节点间的关系。存储控制器通常提供创建 LUN 层次的访问控制的方法,这种访问控制允许为给定 LUN 接入一台或多台主机。通过在存储控制器上提供该访问控制,控制器本身可以对设备强制执行访问策略。
LUN 屏蔽提供了比分区更加细粒的安全性,因为 LUN 提供了端口层面的分区方法。例如,许多 SAN 交换机允许重叠的区域,从而可以使一个存储控制器位于多个区域中。多个区域中的多个群集可以共享这些区域中的控制器上的数据。图 31 说明了此类方案。
图 31:多个区域中的存储控制器
查看大图。
A 群集所用的 LUN 可以从 B 群集屏蔽或隐藏,从而只有授权用户才可以访问共享存储控制器上的数据。
Windows Server 2003 群集和 SAN 的综合部署要求
下面的列表重点列出了在综合部署服务器群集和 SAN 存储解决方案时,需要遵守的一些部署要求。有关结合服务器群集使用 SAN 的更完整信息,可从一份白皮书中获得,请参见 “Web 资源”页面 中的“Windows 群集:存储区域网络”链接 (位于http://www.microsoft.com/windows/reskits/webresources/)。
SAN 上的每个群集都必须在其自己的区域中进行部署。群集用以保护磁盘访问的机制可对相同区域内的其他群集造成负面影响。通过使用分区将群集流量从其他节点或非节点流量孤立出来,就不存在相互干扰的问题。
位于一个单一节点中的所有 HBA 必须是同一种类型,并且具有相同的固件版本。许多存储和交换机供应商要求所有 HBA 位于同一区域上 (有时必须是在相同架构中),且这些 HBA 必须共享这些特性。
群集中所有存储设备的驱动程序和 HBA 设备的驱动程序必须具有相同的软件版本。
不允许多个节点接入相同的存储设备,除非它们位于相同的群集中。
不要将磁带设备放在群集磁盘存储设备所在的同一个区域。磁带设备可能会误解总线休眠,并在不恰当的时候 (如在大型备份过程中) 进行倒带。
结合 Windows Server 2003 服务器群集部署 SAN 的指导方针
除了上面讨论的 SAN 要求外,强烈建议您在服务器群集部署中遵从下列实践:
在一个高度可用的存储架构中,您需要通过多个 HBA 部署群集的服务器。在这些情况下,始终载入多路径驱动程序软件。如果 I/O 子系统发现两个 HBA,会将其假定为不同的总线,并枚举所有的设备,将它们看作是每条总线上的不同设备。同时,主机将看到通向一个磁盘的多条路经。载入多路径驱动程序的失败将禁用第二个设备,因为操作系统将认为它们是具有相同签名的两个独立磁盘。
不要将群集磁盘的硬件快照在相同群集中的节点中公开。硬件快照必须进入服务器群集以外的服务器。许多控制器提供控制器层面的快照,这些快照可作为完全独立的 LUN 公开到群集。当多个设备具有相同的签名时,群集性能会下降。如果快照通过原始磁盘联机重新回到原始节点,I/O 子系统会尝试重写签名。然而,如果快照公开到群集中的另一个节点,群集服务不会将其识别为一个不同的磁盘,因此可能会造成数据遭破坏。虽然这不是一个特定的 SAN 问题,但是 SAN 环境中通常会部署提供该功能的控制器。
其他相关信息,请参见“Microsoft 知识库”中的下列文章:
301647 存储区域网络的群集服务改进
304415 对连接到相同 SAN 设备的多个群集的支持
280743 Windows 群集与地理位置分散的站点
相关链接
更多信息,请参见下列资源:
• |
Microsoft 群集服务安装资源,位于 http://support.microsoft.com/?id=259267 |
• |
仲裁驱动器配置信息,位于 http://support.microsoft.com/?id=280345 |
• |
建议的群集服务器专用心跳配置,位于 http://support.microsoft.com/?id=258750 |
• |
服务器群集中的网络故障检测与恢复,位于 http://support.microsoft.com/?id=242600 |
• |
如何更改仲裁磁盘指定,位于 http://support.microsoft.com/?id=280353 |
• |
Microsoft Windows 群集:存储区域网络,位于 http://www.microsoft.com/windows.netserver/techinfo/overview/san.mspx |
• |
Windows Server 2003 中地理位置分散的群集,位于 http://www.microsoft.com/windows.netserver/techinfo/overview/clustergeo.mspx |
• |
服务器群集的网络要求和最佳实践,位于 http://www.microsoft.com/technet/prodtechnol/windowsserver2003/technologies/clustering/clstntbp.mspx |
有关 Windows Server 2003 的最新信息,请参见 Windows 2003 Server 网站:http://www.microsoft.com/windowsserver2003/default.mspx