IBM HACMP 系列 -- 安装和配置一
规划是成功的实现的一半,就 HACMP 而言,如何强调正确规划的重要性都不过分。如果规划做得不正确,您可能会在以后某个时候发现自己陷入种种限制之中,而要摆脱这些限制可能是非常痛苦的经历。因此,请保持镇定从容,并使用产品附带的规划工作表;这些工作表对于任何迁移或问题确定情形或者对于为规划做文档记录都是非常有价值的。
一. HACMP 软件安装
HACMP 软件提供了一系列可用于使应用程序高度可用的功能。务必记住,并非所有的系统或应用程序组件都受到 HACMP 的保护。
例如,如果某个关键应用程序的所有数据都驻留在单个磁盘上,并且该磁盘发生了故障,则该磁盘就成了整个集群的单点故障,并且未受到 HACMP 的保护。在此情况下,必须使用 AIX 逻辑卷管理器或存储子系统保护功能。HACMP 仅在备份节点上提供磁盘接管,以使数据可继续使用。
这就是 HACMP 规划是如此重要的原因,因为整个规划过程中的主要目标是消除单点故障。当关键集群功能由单个组件提供时,就存在单点故障。如果该组件发生故障,集群没有提供该功能的其他途径,依赖该组件的应用程序或服务就会变得不可用。
还要记住,规划良好的集群非常容易安装,可提供更高的应用程序可用性,能够按预期执行,并且比规划不当的集群需要更少的维护。
1.1 检查先决条件
在完成规划工作表以后,请验证您的系统是否满足 HACMP 所必需的要求;执行这项额外的工作可以消除许多潜在的错误。
HACMP V5.1 需要下列操作系统组件之一:
(1)带 RSCT V2.2.1.30 或更高版本的 AIX 5L V5.1 ML5。
(2)带 RSCT V2.3.1.0 或更高版本(建议使用 2.3.1.1)的 AIX 5L V5.2 ML2。
(3)C-SPOC vpath 支持(需要 SDD 1.3.1.3 或更高版本)。
有关先决条件和 APAR 的最新信息,请参考产品附带的自述文件和以下 IBM 网站:http://techsupport.services.ibm.com/server/cluster/
1.2 全新安装
HACMP 支持网络安装管理(Network Installation Management,NIM)程序,包括“备选磁盘迁移”(Alternate Disk Migration) 选项。您必须在每个集群节点上安装 HACMP 文件集。可以通过使用 NIM 或从本地软件存储库安装 HACMP 文件集。
1.2.1 通过 NIM 服务器进行安装
建议使用 NIM,原因只是由于它允许您从服务器而不是从其他媒体将 HACMP 软件加载到其他节点上。
此外,这是一种分发、更新和管理节点的灵活方法。它允许您并行安装多个节点,并提供一个用于维护软件更新的环境。这在大型环境中是非常有用的,是一种节省时间的方法;对于较小的环境,本地存储库可能就足够了。
如果选择 NIM,则需要将所有 HACMP 文件集复制到 NIM 服务器上,并在继续安装前定义一个 lpp_source 资源。
1.2.2 从 CD-ROM 或硬盘进行安装
如果您的环境只有少数节点,或者感觉使用 NIM 有点大材小用,您可以使用简单的 CD-ROM 安装,或者通过将 HACMP 文件集复制到本地来创建本地存储库,然后使用 exportfs 命令;这允许其他节点使用 NFS 来访问数据。
1.3 安装 HACMP
在安装 HACMP 之前,请确保阅读 /usr/es/lpp/cluster/doc 目录中的 HACMP V5.1 发布说明,以了解有关需求或已知问题的最新信息。
要在服务器节点上安装 HACMP 软件,可以执行以下步骤:
1. 如果直接从诸如 CD-ROM 等安装媒体或从本地存储库进行安装,请输入 smitty install_all 快速路径。SMIT 将显示 Install and Update from ALL Available Software 屏幕。
2. 在 INPUT device/directory for software 字段中输入安装媒体的设备名称或安装目录,然后按 Enter 键。
3. 输入对应的字段值。
要选择希望安装的软件,请按 F4 以获得软件清单,或输入 all 以安装所有服务器和客户端映像。根据您的集群配置选择希望安装的软件包。有些软件包可能需要在您的环境中不可用的软件集(例如,Tivoli Monitoring)。
cluster.es 和 cluster.cspoc 映像(其中包含 HACMP 运行时可执行文件)是必需的,必须安装在所有服务器上。
注意:如果要安装并发资源管理器 (Concurrent Resource Manager) 功能,则必须安装 cluster.es.clvm LPP,而且,如果选择 cluster.es 和 cluster.cspoc,则还必须选择关联的消息软件包。
确保在 Accept new license agreements 字段中选择 Yes。必须对此项选择 Yes 才能继续进行安装。如果选择 No,安装可能会停止,并显示一条关于一个或更多个文件集需要软件许可协议的警告。您只需对每个节点接受一次许可协议。
4. 按 Enter 键开始安装过程。
1.4 安装后的操作
要在安装 HACMP 软件之后完成安装,可以执行以下步骤:
1. 通过使用 AIX 命令 lppchk 验证该软件安装,并检查安装目录以确定预期的文件是否存在。
2. 运行命令 lppchk -v 和 lppchk -c cluster*。如果该安装正常,则两个命令都会顺利运行完成;如果不是这样,请使用适当的问题确定技术以修复任何问题。
3. 尽管不是必需的,但还是建议重新启动 HACMP 环境中的每个集群节点。
如果不希望重新启动,请确保使用以下命令在所有集群节点上启动集群通信守护进程 (clcomdES)。
# startsrc -s clcomdES
1.5 迁移路线和选项
如果您正在进行升级或转换 HACMP 集群的过程,可以使用以下选项:逐个节点的迁移和快照转换。
1.5.1 逐个节点的迁移
如果需要在迁移过程期间使应用程序保持可用,则使用逐个节点的迁移路线。逐个节点的迁移的步骤如下:
1. 停止一个集群节点上的集群服务。
2. 升级 HACMP 软件。
3. 将该节点重新集成到集群中。
此过程也称为“滚动迁移”(“rolling migration”)。此迁移选项具有某些限制;有关更多详细信息,请参见后文的“逐个节点的迁移”。
如果可以接受应用程序的维护时间,则迁移步骤如下:
1. 停止所有集群节点上的集群服务。
2. 升级每个节点上的 HACMP 软件。
3. 一次启动一个节点上的集群服务。
1.5.2 快照迁移
还可以通过使用一个集群快照功能,从而将整个集群转换到 HACMP V5.1。但是,集群将在整个过程中不可用,并且在重新激活集群之前,必须升级所有的节点。
1.6 转换集群快照
此迁移方法是为必须同时升级/迁移 AIX 和 HACMP 的情况而提供的(例如,将 AIX V4.3.3 和 HACMP V4.4.1 迁移到 AIX 5L V5.1 和 HACMP V5.1)。
重要:不要使集群长期处于混合版本状态是非常重要的,因为这样无法保证高可用性。
如果要从早期受支持的 HACMP (HAS) 版本迁移到 HACMP V5.x,您可以迁移集群而不创建快照。如果希望通过与以前安装中相同的方式配置 HACMP,您可以保存来自当前配置的规划工作表和配置文件,以便将来参考。卸载 HACMP 软件组件,使用最新的 HACMP 版本重新安装它们,并根据保存的规划和配置文件对新版本进行配置。
注意:应该注意,在迁移或升级以后,没有任何一个新的 HACMP V5.x 功能是活动的。要激活新功能(增强功能),您需要配置选项并同步集群。
要从受支持的 HAS 版本转换到 HACMP,可以执行以下步骤:
1. 确保当前软件已提交(不是处于应用状态)。
2. 在快照中保存 HAS 集群配置,并保存您希望保留的任何自定义事件脚本。
3. 删除集群中所有节点上的 HAS 软件。
4. 安装 HACMP V5.1 软件。
5. 验证所安装的软件。
6. 转换并应用保存的快照。
集群快照实用程序允许您通过执行以下步骤将集群配置保存到某个文件:
1. 根据需要重新安装任何保存的自定义事件脚本。
2. 重新启动每个节点。
3. 同步并验证 HACMP V5.1 配置。
下面几部分将解释其中每个步骤。
(1)检查以前的 HACMP 版本
要确定系统上是否存在 HACMP Classic (HAS) 软件,可以输入以下命令:
# lslpp -h “cluster*”
如果 lslpp 命令的输出表明 HACMP 已安装,但是版本低于 V4.5,您必须将其至少升级到 V4.5,然后才能继续运行快照转换实用程序。有关更多信息,请参考 HACMP for AIX 5L V5.1 Administration and Troubleshooting Guide, SC23-4862-02。
(2)保存集群配置和自定义事件脚本
要保存 HACMP (HAS)(V4.5 或更高版本)集群配置,请在 HACMP (HAS) 中创建一个快照。如果您有自定义的事件脚本,则还必须保存这些脚本。
注意:请不要在 /usr/sbin/cluster、/usr/es/sbin/cluster 或 /usr/lpp/cluster 中的任何目录路径中保存集群配置或自定义事件脚本。这些目录将在安装新的 HACMP 软件包的过程中被删除并重新创建。
(3)如何删除 HACMP (HAS) 软件
要删除 HACMP 软件和集群节点及客户端上的集群配置,可以执行以下步骤:
输入 smitty install_remove 快速路径。您应该看到示例 1 所示的屏幕。
示例 1 删除已安装的软件
Remove Installed Software
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
* SOFTWARE name [cluster*] +
PREVIEW only?(remove operation will NOT occur) yes +
REMOVE dependent software? no +
EXTEND file systems if space needed? no +
DETAILED output? no +
F1=Help F2=Refresh F3=Cancel F4=List
F5=Reset F6=Command F7=Edit F8=Image
F9=Shell F10=Exit Enter=Do
(4)安装 HACMP V5.1
按照“安装 HACMP”中的说明来安装 HACMP 软件。
注意:在转换并应用保存的快照之前,请不要重新启动。
(5)验证所安装的软件
在安装 HACMP 以后,使用 lppchk 验证预期的文件是否存在。
(6)转换并应用保存的快照
在集群节点上安装 HACMP V5.1 以后,需要转换并应用从以前的配置中保存的快照。
重要:必须在重新启动集群节点之前转换快照。
要转换并应用保存的快照,可以执行以下操作:
1. 使用 clconvert_snapshot 实用程序,并指定 HACMP (HAS) 版本号和要转换的快照文件名。-C 标志将 HACMP (HAS) 快照转换为 HACMP V5.1 快照格式:
clconvert_snapshot -C -v version -s <filename>
2. 应用该快照。
(7)重新安装保存的自定义事件脚本
重新安装从以前的配置中保存的任何自定义事件脚本。
注意:早期版本中使用的某些事件前和事件后脚本可能在 HACMP V5.1 中无法使用,在使用并行处理的资源组中尤其是如此。
(8)重新启动集群节点
重新启动集群节点是激活新的集群通信守护进程 (clcomdES) 所必需的。
(9)验证并同步集群配置
在应用 HACMP 软件并重新启动每个节点以后,必须验证并同步集群拓扑。验证过程可以提供错误和/或警告,以确保集群定义在所有节点上都是相同的。在下面的部分中,我们将简要介绍集群验证过程。
运行 smitty hacmp 并选择 Extended Configuration → Extended Verification and Synchronization,选择 Verify changes only,然后按 Enter 键(请参见示例 2)。
示例 2 HACMP 验证和同步
HACMP Verification and Synchronization (Active Cluster on a Local Node)
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
* Emulate or Actual [Actual] +
Force synchronization if verification fails?[No] +
* Verify changes only?[No] +
* Logging [Standard] +
F1=Help F2=Refresh F3=Cancel F4=List
F5=Reset F6=Command F7=Edit F8=Image
F9=Shell F10=Exit Enter=Do
重要:不能在混合版本的集群中同步配置。在升级时,不应该使集群长期处于混合 HACMP 版本状态。仅当所有节点都已升级并且已经同步了集群时,V5.1 提供的新功能才可用。
(10)逐个节点的迁移
必须考虑以下事项以便执行逐个节点(“滚动”)的迁移:
1) 集群中的所有节点都必须已经安装了 HACMP V4.5,并处于提交状态。
2) 逐个节点的迁移仅适用于从 HACMP (HAS) V4.5 到 HACMP V5.1 的迁移。
3) 集群中的所有节点都必须正常启动并运行 HAS V4.5 软件。
4) 集群必须处于稳定状态。
5) 必须有足够的磁盘空间在迁移过程中保存 HAS 和 HACMP 软件:
/usr 目录中大约需要 120 MB
/(根)目录中大约需要 1.2 MB
6) 当迁移完成时,空间需求将降至 HACMP V5.1 本身所需的正常容量。
7) 节点必须有足够的内存来同时运行 HACMP (HAS) 和 HACMP 守护进程。此内存需求至少为 64 MB 的 RAM。建议使用 128 MB 的 RAM。
8) 检查您不具有在 HACMP 中不受支持的网络类型。一旦迁移开始,就不能再做出配置更改。必须预先删除或更改不受支持的类型。有关详细信息,请参阅 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02 的第 3 章“Planning Cluster Network Connectivity”。
重要:与在任何迁移中一样,一旦开始了迁移过程,就不要尝试对集群拓扑或资源做出任何更改。
9) 如果集群中的任何节点当前设置为在重新启动时自动启动集群服务,则应该在开始迁移过程之前更改此设置。下面的过程描述了如何关闭集群的自动启动。
10) 使用 C-SPOC 来禁用集群服务在系统重新启动时的自动启动。
11) 使用 SMIT 快速路径 smitty clstop,并选择如示例 3 所示的选项。
示例 3 停止集群服务
Stop Cluster Services
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
* Stop now, on system restart or both on system restart +
Stop Cluster Services on these nodes [p630n01] +
BROADCAST cluster shutdown? true +
* Shutdown mode graceful +
F1=Help F2=Refresh F3=Cancel F4=List
F5=Reset F6=Command F7=Edit F8=Image
F9=Shell F10=Exit Enter=Do
如果不使用 C-SPOC,则必须单独地更改每个集群节点上的设置。
(11)如何执行逐个节点的迁移
要执行从 HACMP V4.5 到 HACMP V5.1 的逐个节点的迁移,可以执行以下步骤:
1. 在快照中保存当前配置(作为预防措施)。
将快照放在安全的目录中(不会受安装过程影响的目录)。请不要使用 /usr/sbin/cluster。
2. 使用 graceful with takeover 方法停止其中一个运行 HAS V4.5 的节点上的集群服务。要从命令行停止集群服务,可以运行以下命令:
# /usr/es/sbin/cluster/utilities/clstop -gr
3. 在继续之前,验证该节点上的集群服务已停止,并且其集群资源已转移到接管节点。
4. 在该节点上安装 HACMP V5.1。有关说明请参见“HACMP 软件安装”。
5. 使用 AIX 命令 lppchk 检查所安装的软件。请参见上的“安装后步骤”。
6. 重新启动该节点。
7. 重新启动 HACMP 软件:
a. 输入快速路径 smitty hacmp。
b. 转到 System Management (C-SPOC)。
c. 选择 Manage HACMP Services。
d. 选择 Start Cluster Services。
在重新启动集群服务时:
1) 还会启动 HACMP 软件。
2) HACMP 集群服务将在该节点上运行,并且该节点将重新加入集群。
3) 该节点将重新获取自己所属主节点的级联资源(取决于您的 Inactive Takeover 设置)。
旧的和新的 HACMP 版本(即 HACMP V4.5 和 Enhanced Scalability HACMP V5.1)现在都在该节点上运行,但是只有 HACMP Classic (HAS) 控制集群事件和资源。如果列出由系统资源控制器 (SRC) 控制的守护进程,您将看到此混合节点上列出了下列守护进程(请参见表 1)。
表 1 HACMP 使用的守护进程列表
HACMP |
HACMP/ES |
RSCT |
clstmgr |
clstmgrES |
grpsvcs |
clockd (optional) |
clockdES (optional) |
topsvcs |
clsmuxpd |
clsmuxpES |
emsvcs |
clinfo (optional) |
clinfoES (optional) |
grpglsm |
clcomdES |
emaixos |
8. 对集群中的所有其他节点重复步骤 2 至 6。
注意:启动最后一个节点上的集群服务以后就没有回头路可走了。
一旦重新启动最后一个节点上的 HACMP(将同时重新启动 HACMP 的两个版本),并且迁移已开始,您就无法逆转迁移了。
如果在经过此点以后希望恢复 HACMP 配置,则必须重新安装 HACMP 软件并应用保存的快照。截止到此时,您可以取消 HACMP 的安装并恢复先前运行的 HACMP 集群。如果需要这样做,请参见“撤消过程”。
在安装和迁移过程期间,当您重新启动每个节点时,节点将同时运行两个产品,但是 HACMP clstrmgr 将控制集群事件的处理,而 clstrmgrES 则处于被动模式。
在最后一个节点上启动集群服务以后,到 HACMP 的迁移将自动进行。集群的完全控制权限自动移交给 HACMP V5.1 守护进程。
迁移过程文档的消息将记录到 /tmp/hacmp.out 文件以及 /tmp/cm.log 和 /tmp/clstrmgr.debug 日志文件。
当迁移完成,并且所有集群节点都已启动并正常运行 HACMP V5.1 时,卸载 HACMP (HAS) 软件。
9. 在升级并重新启动所有节点,并且集群处于稳定状态以后,同步并验证该配置。
还应该在任何迁移之后测试集群的正确故障转移和恢复行为。
注意:在逐个节点地从 HAS 4.5 迁移到 HACMP V5.1 的过程中,您将看到下列警告:
sysck:3001-036 WARNING:File /etc/cluster/lunreset.lst is also owned by fileset cluster.base.server.events.
sysck:3001-036 WARNING:File /etc/cluster/disktype.lst is also owned by fileset cluster.base.server.events.
可以安全地忽略这些警告并继续进行安装。
(12)config_too_long 消息
当迁移过程已完成并在卸载 HACMP 文件集时,您可能会看到一条 config_too_long 消息。
当集群管理器检测到某个事件的处理时间超出了指定的时间时,就会出现此消息。config_too_long 消息将不断被追加到 hacmp.out 日志,直到该事件完成。如果观察到这些消息,您应该定期检查该事件是否实际仍在运行并且没有失败。
可以通过增加 HACMP 在调用 config_too_long 事件之前的等待时间来避免这些消息(使用 SMIT)。要更改为某个事件分配的处理间隔,可以执行以下步骤:
1. 输入快速路径 smitty hacmp。
2. 转到 Extended Configuration。
3. 选择 Extended Event Configuration。
4. 选择 Change/Show Time Until Warning。
必须在每个节点上执行此过程。更改将在重新启动集群服务以后生效。
(13)逐个节点的迁移过程是如何工作的
在所有节点上安装 HACMP 以后(现在所有节点都处于混合版本状态),在最后一个集群节点上启动集群服务会自动触发到 HACMP V5.1 的控制权移交,如下所示:
1. 安装 HACMP V5.1 将在集群节点上的某个固定目录中安装一个名为 firstboot 的恢复文件,并创建一个要在迁移过程中用作标志的迁移文件 (.mig)。
2. HACMP 恢复驱动程序将向 HACMP 集群管理器发送一条消息,告诉它运行 waiting 和 waiting_complete 事件。
1) HACMP 使用 RSCT 组服务来验证集群稳定性和成员资格。
2) 将每个集群节点上的 firstboot 文件移动到一个活动目录 (/etc)。
3) 在所有节点上,将安装期间创建的迁移标志(.mig 文件)从 HACMP V5.1 目录转移到 HACMP V4.5 目录。
在将 firstboot 文件移动到活动目录并在所有节点上完成 .mig 文件转移之后,到 HACMP 的控制权移交将继续触发 HACMP 迁移事件。
3. HACMP 恢复驱动程序发出迁移事件。
1) HACMP V5.1 使用 forced 选项停止 HACMP V4.5 守护进程。
2) 全部激活 HACMP V5.1 clinfoES 和 clsmuxpdES 守护进程,并重用那些守护进程的 HACMP V4.5 版本以前所使用的端口。
4. HACMP V5.1 恢复驱动程序将运行 migrate_complete 事件。
1) 卸载 HACMP V4.5。两个产品共有的配置文件保持不变。
2) 重新链接基本目录。
3) 删除 /etc/firstboot 文件。
4) 删除 HACMP /usr/sbin/cluster 目录中的迁移标志(.mig 文件)。
5. 迁移工作到此结束。
(14)迁移期间保存的集群快照
预先存在的 HACMP 快照保存在 /usr/es/sbin/cluster/snapshots 目录中。
(15)处理迁移过程中的节点故障
在将节点的 firstboot 文件移动到某个活动目录以后,如果节点在迁移期间发生故障,则会在节点重新启动期间完成迁移过程。但是,故障节点在重新集成到集群中时,可能有不同步的 HACMP ODM。在此情况下,应该在将故障节点重新集成到集群中之前同步集群拓扑和资源。
(16)撤消过程
如果由于某种原因而决定不完成迁移过程,您可以在启动最后一个节点上的 HACMP 之前的任何时候,在已安装 HACMP V5.1 软件的节点上卸载 HACMP V5.1。
注意:仅在本地节点上卸载 HACMP 软件。在迁移期间,请不要选择用于卸载多个节点中的软件的选项。
要卸载 HACMP 软件,可以执行以下操作:
1. 在每个节点上,逐个地停止集群服务。
要停止集群服务,请参见示例3。
在继续之前,检查该节点上的集群服务已停止,并且其集群资源已转移到接管节点。
2. 当您确信节点上的资源已正确转移到接管节点时,删除 HACMP V5.1 软件。请参见 “如何删除 HACMP (HAS) 软件”。
3. 在该节点上启动 HACMP。当您确信资源已正确转移回该节点(若需要的话)时,在下一个节点上重复这些步骤。
4. 继续此过程,直到从集群中的所有节点删除 HACMP。
(17)处理逐个节点的迁移过程中的同步故障
如果尝试在迁移未完成时对集群拓扑或资源做出更改,同步过程将会失败。您将接收到以下消息:
cldare:Migration from HACMP V4.5 to HACMP V5.1 Detected. cldare cannot be run until migration has completed.
要撤消更改,必须恢复活动的 ODM。请执行以下步骤:
1. 输入 smitty hacmp。
2. 转到 Problem Determination Tools。
3. 选择 Restore HACMP Configuration Database from Active Configuration。
1.7 升级选项
下面将讨论 HACMP 升级。受支持的 HACMP V5.1 升级
HACMP 转换实用程序提供了从下面列出的版本升级到 V5.1 的简单升级路线:
1) HACMP/ES V4.4.1 到 HACMP V5.1
2) HACMP/ES V4.5 到 HACMP V5.1
如果希望从比上面列出的版本更早的版本转换到 HACMP V5.1,则必须首先升级到上述受支持的版本之一。然后您将能够转换到 HACMP V5.1。例如,要从 HACMP/ES 4.2.2 转换到 HACMP V5.1,必须首先执行到 HACMP/ES 4.4.1 或更高版本的安装升级,然后再执行到 HACMP V5.1 的升级。
要升级到 HACMP V5.1,可以执行以下步骤:
1. 根据需要升级到 HACMP V5.1 维护级别 5 或更高级别。
2. 根据需要检查并验证 AIX 安装。
3. 在所有节点上提交当前的 HACMP 软件。
4. 使用 clstop 命令停止一个节点上的 HACMP/ES。
5. 在资源从已停止的节点成功转移到接管节点以后,安装新的 HACMP 软件。
有关安装 HACMP V5.1 软件的说明,请参阅“HACMP 软件安装”。
通过使用 AIX 命令 lppchk 验证该软件安装,并检查安装目录以确定预期的文件是否存在:
lppchk -v 或 lppchk -c “cluster.*”
如果该安装正常,则两个命令都应该会顺利运行完成。
6. 重新启动第一个节点。
7. 使用 smitty clstart 启动第一个节点上的 HACMP 软件,并验证第一个节点成功加入了集群。
8. 一次一个节点地在其余集群节点上重复上述步骤。
9. 检查 tty 设备是否已配置为串行网络。
10. 检查所有外部磁盘均在第一个节点上可用(使用 lspv 来检查每个磁盘的 PVID)。如果未显示磁盘的 PVID,您可能需要删除磁盘并重新配置它们。
11. 在完成所有节点的升级以后,按照 “验证升级后的集群定义”中的描述,将节点配置和集群拓扑从节点 A 同步到所有节点。请不要跳过同步期间的验证。
重要:在升级时,当某个还未升级的节点仍在混合版本的集群中时,切勿从某个已升级的节点同步集群定义。cl_convert 实用程序分配跨集群中的所有节点保持一致的节点 ID。这些新 ID 可能与已经存在的 ID 发生冲突。
12. 恢复 HACMP 事件 ODM 对象类,以保存已经为集群配置的任何事件前和事件后脚本。
13. 根据需要对集群做出附加更改。
14. 在投入生产应用前对集群完成一个测试阶段。
1.7.1 cl_convert 和 clconvert_snapshot
HACMP 转换实用程序是 cl_convert 和 clconvert_snapshot。
将 HACMP/ES 软件升级到最新版本的 HACMP 涉及到将 ODM 从早期版本转换到最新版本的 ODM。在安装 HACMP 时,将会自动运行 cl_convert。但是,如果安装失败,则必须从命令行运行 cl_convert。
在转换失败的情况下,请使用 –F 标志运行 cl_convert。例如,要从 HACMP/ES V4.5 转换到 HACMP V5.1,可以按如下方式使用 -F 和 –v(版本)标志(请注意为 V4.5 添加的“0”):
# /usr/es/sbin/cluster/conversion/cl_convert -F -v 4.5.0
运行转换实用程序将需要:
1) Root 用户权限
2) 要转换的源 HACMP 版本
cl_convert 实用程序将转换进度记录到 /tmp/clconvert.log 文件,以便您能判断转换是否成功。此日志在每次执行 cl_convert 或 clconvert_snapshot 时生成(被改写)。
clconvert_snapshot 实用程序不会在安装期间自动运行,而是必须从命令行运行。按照 “cl_convert 和 clconvert_snapshot”中的描述,在从 HACMP (HAS) 迁移到 HACMP 时运行 clconvert_snapshot 以升级集群快照。
1.7.2 升级并发资源管理器
要在集群节点上安装并发访问功能,请使用“HACMP 软件安装”中列出的过程来安装并发资源管理器(Concurrent Resource Manager,CRM)。
AIX 5L V5.1 支持增强并发模式 (ECM)。如果要安装带并发资源管理器功能的 HACMP,请参阅 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02 中的第 2 章“Initial Cluster Planning”。
有关增强并发模式和受支持的 IBM 共享磁盘设备的信息,请参阅 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02 中的第 5 章“Planning Shared LVM Components”。此外,如果希望使用来自其他制造商的磁盘,请参阅 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02 中的附录 D“OEM Disk Accommodation”。
1.7.3 安装期间的问题
如果在安装期间遇到问题,安装程序会自动执行一个清理过程。如果由于某种原因,在失败的安装之后没有执行清理,可以执行以下步骤:
1. 输入 smitty install。
2. 选择 Software Maintenance and Utilities。
3. 选择 Clean Up After a Interrupted Installation。
4. 检查 SMIT 输出(或检查 /smit.log 文件)以确定中断原因。
5. 通过使用 AIX 问题确定技术来修复任何问题,并重复安装过程。
二. 网络配置
集群节点通过通信网络进行彼此通信。如果某个节点上用于某个网络的其中一个物理网络接口卡 (NIC) 发生故障,则 HACMP 通过将流量转移到同一节点上的另一个物理网络接口卡,从而保持到该节点的通信。如果到该节点的“连接”失败,则 HACMP 将把资源转移到另一个可用节点。
此外,HACMP(通过 RSCT 拓扑服务)使用节点之间的心跳信号消息(通过集群网络),定期检查集群节点和通信接口的可用性。如果 HACMP 没有检测到来自某个节点的心跳信号,则认为该节点已发生故障,其资源将自动转移到另一个节点。
强烈建议在集群节点之间配置多条通信路线。拥有多个网络可以防止集群分割(“裂脑”((“split brain”))。分割集群中的危险之处在于,每个分区中的节点可能不协调地同时访问相同数据,从而导致数据破坏。
2.1 网络类型
物理和逻辑网络
物理网络连接两个或更多个物理网络接口。存在许多类型的物理网络,HACMP 大致将它们分类为基于 IP 的网络和非 IP 网络:
1) 基于 TCP/IP 的网络,例如以太网或令牌环网
2) 基于设备的网络,例如 RS-232 或目标模式 SSA (tmssa) 网络
在 HACMP 中,所有能够直接彼此通信的网络接口都分组到一个逻辑网络中。HACMP 为每个 HACMP 逻辑网络分配一个名称(例如,net_ether_01)。HACMP 中的逻辑网络可以包含一个或多个 IP 子网。RSCT 管理每个逻辑子网中的心跳信号数据包。
2.2 全局网络
全局网络是多个 HACMP 网络的组合。HACMP 网络可以由物理上不同的网络和/或不同的逻辑网络(子网)的任何组合组成,只要它们共享相同的“冲突域”(collision domain),例如 Ethernet。HACMP 将组合的全局网络视为单个网络。RSCT 处理全局网络中定义的网络之间的路由。
2.3 TCP/IP 网络
HACMP 支持的基于 IP 的网络包括:
1) ether(以太网)
2) atm(异步传输模式,ATM)
3) fddi(光纤分布式数据接口,FDDI)
4) hps(SP 交换)
5) token(令牌环)
此类基于 IP 的网络由 HACMP 通过 RSCT 拓扑服务进行监视。
2.3.1 通过 IP 别名的心跳检测
在 HACMP V5.1 中,可以配置通过 IP 别名的信号检测。在以前版本的 HACMP 中,检测信号是通过服务和非服务 IP 地址/标签(基本或启动 IP 地址/标签)进行交换的。
使用此配置,通信接口的 IP 启动地址可以驻留在同一个子网或不同的子网上。RSCT 使用自动分配并分组到不同子网中的 IP 别名,为每个通信接口组建立单独的心跳信号环。可以将非可路由的子网用于检测信号环,并将其它子网保留用于可路由的(客户端)流量。
有关通过基于 IP 的网络的检测信号配置的更多信息,请参阅后文的“定义通信接口”。
2.3.2 持久 IP 地址/标签
持久节点 IP 标签是一个 IP 别名,可以将其分配给网络上的某个特定节点。持久节点 IP 标签是具有以下特征的标签:
1) 始终保持在同一个节点上(与节点绑定)
2) 与同一个接口上存在的其他 IP 标签共存
3) 不需要在该节点上安装附加的物理接口
4) 不属于任何资源组
在节点上分配用于某个网络的持久节点 IP 标签使您可以在集群网络上拥有与节点绑定的地址,此地址可以访问集群中的特定节点来进行管理。有关更多信息,请参后文的“定义持久 IP 标签”。
2.3.3 非 IP 网络
HACMP 中的非 IP 网络用作在集群节点之间交换消息的独立路径。在 IP 子系统发生故障的情况下,当存在某个独立路径可用并且有效时,HACMP 仍然可以区分网络故障和节点故障。下面是对四种当前可用的非 IP 网络类型及其特征的简略描述。尽管可以配置没有非 IP 网络的 HACMP 集群,但是强烈建议在集群节点之间至少使用一个非 IP 连接。
HACMP 目前支持将下列类型的网络用于集群节点之间的非 TCP/IP 心跳信号交换:
(1). 串行网络 (RS232)
(2). 磁盘检测信号网络 (diskhb)
(3). 目标模式 SSA 网络 (tmssa)
(4). 目标模式 SCSI 网络 (tmscsi)
(1)串行网络 (RS232)
串行 (RS232) 网络至少需要每个集群节点有一个可用的串行端口。在由两个以上的节点组成的集群的情况下,将通过串行连接建立一个节点环,从而要求每个节点有两个串行端口。
在本机串行端口数量与 HACMP 集群配置需要不匹配的情况下,可以通过添加八端口的异步适配器来扩充串行端口。有关更多信息,请参见后文的“定义通信设备”。
(2)磁盘心跳信号网络
在某些情况下,RS232、tmssa 和 tmscsi 连接可能成本太昂贵,或者设置起来太复杂。通过磁盘的信号检测 (diskhb) 可以为用户提供:
(1). 非常易于配置的点对点网络类型。
(2). 预防集群分割的附加保护。
(3). 可使用任何磁盘类型来形成数据路径的点对点网络类型。
(4). 不需要附加硬件的设置;可以使用同时还用于数据并包括在资源组中的磁盘。
为了支持 SSA 并发 VG,每个磁盘上有一小部分保留空间用于 clvmd 通信。增强并发 VG 不使用该保留空间来通信;相反,它们使用 RSCT 组服务。
磁盘心跳信号使用一个保留扇区(保留用于 SSA 并发模式 VG 的扇区),节点可将其用作交换 Keep Alive 消息的区域。
属于增强并发 VG 的任何磁盘都可用于 diskhb 网络,包括用于数据存储的磁盘。此外,包含用于 diskhb 网络的磁盘的 VG 不必启用。
可以将任何磁盘类型配置为增强并发 VG 的一部分,从而使得这种类型的网络极其灵活。有关配置磁盘检测信号网络的更多信息,请参见 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02 中的第 3 章“Planning Cluster Network Connectivity”。
(3)目标模式 SSA
如果使用共享 SSA 设备,可以将目标模式 SSA 用于 HACMP 中的非 IP 通信。这依赖 SSA 适配器的内置功能(使用 SCSI 通信协议)。SSA 环路(磁盘和适配器)中的 SSA 设备使用“发起者”和“目标”之间的通信;SSA 磁盘是“目标”,但是 SSA 适配器同时具有两个功能(“发起者”和“目标”);因而,tmssa 连接使用这些功能在 HACMP 节点之间建立串行式的链路。这是一个点对点的通信网络,只能在两个节点之间通信。
要在集群节点之间配置 tmssa 网络,该节点中的 SSA 适配器(一个或多个)必须是包含共享磁盘的 SSA 环路的一部分。在此情况下,必须为每个节点分配一个唯一的 SSA 路由器设备 (ssar) 节点编号。
要更改系统的 SSA 节点编号,可以执行以下步骤:
1. 运行 smitty ssa 快速路径。
2. 选择 Change/Show SSA Node Number of this System。
3. 将节点编号更改为集群环境中的唯一编号。
注意:在使用并发磁盘访问的集群中,SSA 路由器编号必须与 HACMP 节点编号匹配(与之相同);否则,您将无法以并发模式 Varyon 共享卷组。
(4)目标模式 SCSI
另一种可能的非 IP 网络是目标模式 SCSI 连接。
每当使用共享 SCSI 设备的时候,您还可以使用 SCSI 总线来交换心跳信号。只有 SCSI-2 Differential 或 SCSI-2 Differential Fast/Wide 设备才支持目标模式 SCSI (tmscsi)。SCSI-1 Single-Ended 和 SCSI-2 Single-Ended 不支持 HACMP 集群中的串行网络。
建议不要在今后的任何配置中使用此类网络(因为磁盘心跳信号网络要与受支持的任何类型的共享 SCSI 磁盘一起工作)。
三. 存储配置
存储配置是必须在开始 HACMP 集群配置之前执行的最重要任务之一。可以将存储配置视为 HACMP 配置的一部分。
根据应用程序的需要和存储的类型,您必须决定集群中有多少个节点将拥有共享存储访问,以及哪些资源组将使用哪些磁盘。
HACMP 支持大多数 IBM 存储子系统。要了解有关存储服务器支持的更多信息,请参见 HACMP for AIX 5L V5.1 Planning and Installation Guide,SC23-4861-02。
最常用的共享存储子系统包括:
(1). 光纤连接存储服务器 (FAStT)
(2). 企业存储服务器 (ESS/Shark)
(3). 串行体系结构存储 (SSA)
存储保护(数据或其他方面)独立于 HACMP;对于高可用性存储,必须使用具有适当冗余和容错级别的存储。HACMP 不具有对存储可用性的任何控制。
对于数据保护,可以使用 RAID 技术(在存储或适配器级别)或 AIX LVM 镜像。
3.1 独立磁盘冗余阵列(Redundant Array of Independent Disk,RAID)
磁盘阵列是磁盘驱动器组,这些驱动器协同工作以实现高于单个(独立)驱动器的数据传输速率。阵列还可以提供数据冗余,以便在阵列中的一个驱动器(物理磁盘)发生故障时,数据不会丢失。取决于 RAID 级别,数据将实现镜像或条带化,或者同时实现这两者。
3.1.1 RAID 0
RAID 0 也称为数据条带化 (data striping)。传统上,文件按顺序写入到单个磁盘。使用条带化,信息将划分为字节块(固定容量的数据,通常称为“块”),并将这些块并行写到一系列磁盘(或从一系列磁盘并行读取这些块)。这种方法具有两个性能优点:
(1). 由于多个 I/O 流同时进行,数据传输速率比顺序操作更高。
(2). 由于数据的分布性消除了访问模式偏差,随机访问吞吐量得到了提高。这意味着,对于跨许多磁盘均匀分布的数据,随机访问很可能会发现所需的信息跨多个磁盘分布,从而得益于比单个磁盘更高的吞吐量。
RAID 0 的唯一目的是提高性能。不存在冗余,因此任何磁盘故障都需要从备份中重新加载数据。
3.1.2 RAID 1
RAID 1 也称为数据镜像。在这种实现中,每个数据块的相同副本保存在单独的磁盘上,或在更常见的情况下,每个磁盘具有包含信息的准确副本(或镜像映像)的“孪生磁盘”。如果阵列中的任何磁盘发生故障,则镜像磁盘将维持数据可用性。读取性能可以增强,因为始终使用其动臂机构(磁头)最靠近所需数据的磁盘,从而最小化寻道时间。
写入操作的响应时间会比单个磁盘稍慢一点,具体取决于写入策略;写入操作可以并行(为了实现更快的响应)或顺序(为了实现安全性)执行。
RAID Level 1 具有数据冗余,但是应该定期保存数据(备份)。这是在文件或目录被意外破坏或删除时用于恢复数据的唯一途径。
3.1.3 RAID 2 和 RAID 3
RAID 2 和 RAID 3 是并行处理阵列机制,其中阵列中的所有驱动器协同操作。与数据条带化类似,要写入到磁盘的信息划分为字节块(固定容量的数据),每个块被写到单独的磁盘上的相同物理位置(并行)。在进行读取时,可以同时向每个磁盘发送数据请求。这种体系结构要求为每个数据条带写入奇偶校验信息;RAID 2 和 RAID 3 之间的区别在于,RAID 2 可以利用多个磁盘驱动器实现奇偶校验,而 RAID 3 只能利用一个磁盘驱动器。如果某个驱动器发生故障,系统可以在奇偶校验信息和其余驱动器的基础上重新构造丢失的数据。针对大容量数据的性能非常优异,但是小容量数据请求的性能非常糟糕,因为始终要涉及到每个驱动器,并且不能存在重叠或独立的操作。
3.1.4 RAID 4
RAID 4 通过使用更大的数据块,并跨所有驱动器(保留用于奇偶校验的驱动器除外)对数据进行条带化,从而解决了 RAID 3 的某些缺点。使用磁盘条带化意味着 I/O 请求只需涉及到所需数据实际所在的驱动器。这意味着可以实现同时以及独立的读取。但是,写入请求需要一个读取/修改/更新周期,从而在单个奇偶校验驱动器上导致瓶颈。
必须读取每个条带,插入新数据,然后在将条带写回磁盘之前计算新的奇偶校验信息。然后再使用新的奇偶校验信息更新奇偶校验磁盘,但是在完成此操作之前,不能将该磁盘用于其他写入操作。这个瓶颈意味着,RAID 4 使用得不如 RAID 5 那么多,后者实现了相同的过程,但是没有瓶颈。
3.1.5 RAID 5
RAID 5 非常类似于 RAID 4。区别在于,奇偶校验信息也跨用于数据的相同磁盘分布,从而消除了该瓶颈。奇偶校验数据决不会与它所保护的数据块存储在相同的驱动器上。这意味着,现在可以执行并发读取和写入操作,并且由于可以使用一个额外的磁盘(以前用于奇偶校验信息的磁盘),性能也提高了。还存在其他可能的增强,以进一步提高数据传输速率,例如缓存从磁盘进行的同时读取,并在读取接下来的块时传输该信息。这可以实现接近适配器速度的数据传输速率。
与 RAID 3 一样,在磁盘发生故障的情况下,可以在其余驱动器的基础上重新构建信息。RAID 5 阵列也使用奇偶校验信息,虽然创建阵列中的数据的定期备份仍然非常重要。RAID 5 阵列一次一个段(一个段可以包含多个块)地跨阵列中的所有驱动器对数据进行条带化。在具有 n 个驱动器的阵列中,一个条带包括写到其中“n-1”个驱动器的数据段和一个写到“第 n 个”驱动器的奇偶校验段。这种机制还意味着,并非所有磁盘空间都可用于存储数据。例如,在具有五个 72 GB 磁盘的阵列中,尽管总存储空间为 360 GB,但是只有 288 GB 可用于存储数据。
3.1.6 RAID 0+1 (RAID 10)
RAID 0+1 也称为 IBM RAID-1 Enhanced 或 RAID 10,是 RAID 0(数据条带化)和 RAID 1(数据镜像)的组合。RAID 10 提供了 RAID 0 的性能优点,同时保持了 RAID 1 的数据可用性。在 RAID 10 配置中,数据及其镜像都跨阵列中的所有磁盘进行条带化。第一个条带是数据条带,第二个条带是镜像,镜像与数据放在不同的物理驱动器上。RAID 10 实现可以提供优异的写入性能,因为它们不必计算或写入奇偶校验数据。RAID 10 可以通过软件 (AIX LVM)、硬件(存储子系统级别)或通过硬件和软件的组合来实现。具体的实现解决方案取决于总体需求。RAID 10 的成本特征与 RAID 1 相同。
表 2 列出了当今的 IT 实现中使用的最常见 RAID 级别。
表 2 广泛使用的 RAID 级别的特征
RAID 级别 |
可用磁盘容量 |
读取/写入操作性能 |
成本 |
数据保护 |
RAID 0 |
100% |
读取/写入性能都非常高 |
低 |
否 |
RAID 1 |
50% |
中/高读取性能,中等写入性能 |
高 |
是 |
RAID 5 |
80% |
高读取性能 |
中 |
是 |
RAID 10 |
50% |
读取/写入性能都非常高 |
高 |
是 |
3.2 光纤连接存储服务器 (FAStT)
存在不同型号的 FAStT 存储可用并在 HACMP 中受支持。
介绍所有型号的 FAStT 超出了本红皮书的范围。为了解如何配置 FAStT 存储,我们将提供 FAStT900 存储服务器的示例。
3.2.1 FAStT900 存储服务器
FAStT900 存储服务器最多支持四个主机的直接连接(每个主机包含两个主机适配器),并旨在提供最大限度的主机端和驱动器端冗余。通过将外部光纤通道交换机与 FAStT900 存储服务器结合使用,最多可以将 64 个主机(每个主机都具有两个主机总线适配器)连接到一个 FAStT900 存储服务器。
在配置 FAStT 存储之前,必须确保按照所需的配置完成所有硬件和电缆连接。有关 FAStT 电缆连接的更多信息,请参见 IBM TotalStorage FAStT900 Fibre Channel Storage Server Installation Guide, GC26-7530。
3.2.2 FAStT Storage Manager 软件
配置 FAStT 存储的唯一途径是使用 FAStT Storage Manager 软件。大多数流行的操作系统都提供了 FAStT Storage Manager 软件,例如 AIX、Linux 和 Windows® XP/2000。使用 FAStT Storage Manager,您可以配置受支持的 RAID 级别、逻辑驱动器和分区。受支持的 RAID 级别为 RAID 0、RAID 1、RAID 5 和 RAID 0+1。
FAStT Storage Manager 中不存在配置 RAID 10 的选项。选择带多个磁盘的 RAID 1,FAStT Manager 将负责处理数据的条带化和镜像。
它允许用户根据操作系统的需要格式化逻辑驱动器。存在不同的 Storage Manager 版本。Storage Manager V8.4 是 FAStT900 支持的 Storage Manager 版本,相比于早期版本,此版本具有一些较新的功能。
带 Storage Manager V8.4 的 FAStT900 支持的一些新功能包括:
(1)FlashCopy。
FlashCopy 逻辑驱动器是存储子系统中的另一个逻辑驱动器(称为基本逻辑驱动器)的时间点映像。FlashCopy 是完整的物理副本的逻辑等效副本,但是可以更快地创建,并且只需较少的磁盘空间(原始逻辑驱动器的 20%)。
(2)远程镜像选项
远程镜像选项用于实现存储子系统之间远距离的在线、实时复制。
(3)Volumecopy
volumecopy 选项是一种基于固件的机制,用于复制存储阵列中的逻辑驱动器数据。用户通过指定两个兼容驱动器来提交 volumecopy 请求。一个驱动器指定为源,另一个指定为目标。volumecopy 请求是持久性的,以便能够将该复制过程的任何相关结果传达给用户。
(4)存储分区
存储分区允许用户通过将存储卷映射到某个 LUN 编号,每个分区提供 0-255 的 LUN,从而通过多个不同的分区将所有存储卷提供给 SAN。这种卷或 LUN 映射仅适用于已配置为访问该 LUN 的主机端口。此功能还允许将使用不同操作系统及其各自的唯一磁盘存储子系统设置的主机同时连接到同一个 FAStT 存储服务器。
有关 Storage Manager V8.4 安装和配置的更多信息,请参阅 IBM TotalStorage FAStT Storage Manager 8.4 Installation and Support Guide for Intel-based Operating Environments, GC26-7589。
3.3 企业存储服务器 (ESS/Shark)
IBM 企业存储服务器 (ESS) 是一种第二代 Seascape® 磁盘存储系统,并提供了领先的可用性、性能、可管理性和可伸缩性。ESS 中的 RAID 级别在某些配置中是预定义的,只有非常有限的修改余地。可用的 RAID 级别是 RAID 1、RAID 5 和 RAID 0+1。
IBM 企业存储服务器 (ESS) 不仅仅是实现跨企业平台的共享存储;它还可以通过各种各样的强大功能,从而提高了企业范围的存储资源的性能、可用性、可伸缩性和可管理性。其中部分功能在名称上与 FAStT 存储中可用的功能的名称相同,但是其技术概念在很大程度上是不同的。其中部分功能包括:
(1)FlashCopy
FlashCopy 提供快速的数据复制功能。此选项帮助消除对长时间停止应用程序以执行备份和还原的需要。
(2)点对点远程复制
此功能在远程位置维护数据的同步副本(始终保持与主副本一样的最新状态)此数据备份副本可用于从主系统的故障中快速恢复而不丢失任何事务;这是一个可选功能,完全可以保持电子商务应用程序的正常运行。
(3)扩展远程副本 (XRC)
此功能在远程位置(可使用电信线路从无限距离的位置连接到该位置)提供一个数据副本,在主存储系统发生故障的情况下将使用该副本。ESS 通过对计划外停机的完全支持来增强了 XRC。在电信链路发生故障的情况下,这个可选功能允许快速重新同步辅助远程副本,而不需要从主位置复制所有数据来实现灾难恢复保护。
(4)自定义卷
自定义卷允许为高端服务器定义各种大小的卷,从而使管理员可以配置系统以实现最佳性能。
(5)存储分区
存储分区通过为每个服务器提供对自己的存储容量池的访问,从而更高效地利用存储设备。存储池可以在多个服务器之间共享。
有关企业存储服务器配置的更多信息,请参阅 IBM TotalStorage Enterprise Storage Server Service Guide 2105 Model 750/800 and Expansion Enclosure, Volume 1, SY27-7635。
3.4 串行存储体系结构(Serial Storage Architecture,SSA)
串行存储体系结构是一种行业标准接口,用于提供 I/O 存储设备的高性能容错连接。在 SSA 子系统中,到多个目的地的传输是多路的;各个链路的空间重用进一步增加了有效带宽。命令沿着环路从一个设备自动转发到另一个设备,直到到达目标设备。多个命令可以同时绕着环路传输。
SSA 支持 RAID 0、RAID 1、RAID 5 和 RAID 0+1。要使用任何 RAID 设置,必须遵循 SSA 机箱的回路连接说明。
需要在整个磁盘中进行特定的环路连接才能创建 RAID。有关 IBM SSA RAID 配置的更多信息,请参阅 IBM Advanced SerialRAID Adapters Installation Guide, SA33-3287。
3.5 共享 LVM
对于 HACMP 集群,关键要素是高度可用的应用程序所使用的数据。此数据存储在 AIX 逻辑卷管理器(Logical Volume Manager,LVM)实体上。
HACMP 集群使用 LVM 的功能来使多个节点可访问该数据。AIX 逻辑卷管理器提供从多个节点进行的共享数据访问。共享逻辑卷管理器的部分组件包括:
(1). 共享卷组是完全驻留在由集群节点共享的外部磁盘上的卷组。
(2). 共享物理卷是驻留在共享卷组中的磁盘。
(3). 共享逻辑卷是完全驻留在共享卷组中的逻辑卷。
(4). 共享文件系统是完全驻留在共享逻辑卷中的文件系统。
如果您是某个 HACMP 集群的系统管理员,可能会要求您执行下面许多与 LVM 相关的任务:
(1). 创建新的共享卷组。
(2). 扩展、缩小、更改或删除现有的卷组。
(3). 创建新的共享逻辑卷。
(4). 扩展、缩小、更改或删除现有的逻辑卷。
(5). 创建新的共享文件系统。
(6). 扩展、更改或删除现有的文件系统。
(7). 添加和删除物理卷。
在共享 LVM 组件上执行任何维护任务时,应确保在导出然后重新导入卷组时重置所有权和权限。
在导出和导入后,卷组由 root 拥有,并且可由系统组访问。
注意:如果更改了原始逻辑卷设备的所有权,使用原始逻辑卷的应用程序可能会受到此更改的影响,例如某些数据库服务器。必须在此操作序列之后将所有权和权限恢复为所需的所有权和权限。
可以通过以下任何数据访问模式使共享逻辑卷访问变得可用:
(1). 非并发访问模式
(2). 并发访问模式
(3). 增强并发访问模式
3.5.1 非并发访问模式
非并发访问环境中的 HACMP 通常使用日记记录文件系统来管理数据,尽管有些数据库应用程序可能绕过日记记录文件系统并直接访问逻辑卷。
LVM 的非并发访问同时支持镜像和非镜像配置。有关创建镜像和非镜像逻辑卷的更多信息,请参阅 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02。
要在节点上创建非并发共享卷组,可以执行以下步骤:
1. 使用快速路径 smitty mkvg。
2. 除非站点有其他特定要求,否则请使用缺省字段值。
(1)VOLUME GROUP name:共享卷组的名称应该在集群中是唯一的。
(2)Activate volume group AUTOMATICALLY at system restart?:设置为 No,以便由集群事件脚本根据情况激活该卷组。
(3)ACTIVATE volume group after it is created?:设置为 Yes。
(4)Volume Group MAJOR NUMBER:确保在所有节点上使用相同的主编号。在每个节点上使用 lvlstmajor 命令来确定所有节点共有的未使用主编号。
要在节点上创建非并发共享文件系统,可以执行以下步骤:
1. 使用快速路径 smitty crjfs。
2. 同时重命名文件系统和卷组的逻辑卷和日志逻辑卷。
AIX 为其创建的每个逻辑卷分配一个逻辑卷名称。
逻辑卷名称的示例为 /dev/lv00 和 /dev/lv01。在 HACMP 集群中,任何共享逻辑卷的名称必须是唯一的。此外,日记记录文件系统日志 (jfslog) 也是需要在集群中具有唯一名称的逻辑卷。
3. 检查以下字段的设置:
(1)Mount automatically at system restart?:确保将此字段设置为 No。
(2)Start Disk Accounting:除非希望进行磁盘记帐,否则请将此字段设置为 No。
4. 通过挂载和卸载新创建的文件系统来对其进行测试。
将卷组导入故障转移节点
在导入卷组之前,请确保从主节点 Varyoff 该卷组。然后可以运行 HACMP 的发现过程(discovery process),此过程将收集有关跨所有节点可用的所有卷组的信息。
将卷组导入故障转移节点将会同步该卷组在每个所导入节点上的 ODM 定义。
在将卷组添加到资源组时,可以选择手动将卷组导入故障转移节点,或者可以选择自动将其导入资源组中的所有故障转移节点。
有关导入卷组的更多信息,请参见 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02。
注意:在故障转移节点上导入卷组以后,必须更改卷组的启动状态。根据 HACMP 的要求,使用以下命令来更改卷组状态:
# chvg -an -Qn <vgname>
此命令将禁用系统重新启动时的自动 Varyon,同时还禁用该卷组的定额。
3.5.2 并发访问模式
将并发访问与 HACMP 一起使用需要安装附加的文件集。有关更多信息,请参见系列的第 2 部分“规划和设计”。
文件系统不支持并发访问模式;相反,您必须使用原始逻辑卷或物理磁盘。
1).创建并发访问卷组
1. 物理卷 (hdisk*) 应该已安装、配置并且可用。
可以使用以下命令验证磁盘的状态:# lsdev -Cc disk
2. 要使用并发访问卷组,必须将其创建为支持并发的卷组。支持并发的卷组可以在非并发模式或并发访问模式下激活(启用)。
要创建并发访问卷组,可以执行以下步骤:
a. 输入 smit cl_convg。
b. 选择 Create a Concurrent Volume Group。
c. 根据需要输入字段值。
d. 按 Enter 键。
2). 导入支持并发的卷组
通过运行以下命令来导入支持并发的卷组:
# importvg -C -y vg_name physical_volume_name
将卷组中的任何磁盘的名称指定为 importvg 命令的参数。缺省情况下,AIX 在导入非支持并发的卷组时自动 Varyon 这些卷组。AIX 在导入支持并发的卷组时不自动 Varyon 这些卷组。
3). 以非并发模式 Varyon 支持并发的 VG
必须以非并发模式 Varyon 支持并发的卷组才能创建逻辑卷。使用 varyonvg 命令以非并发模式激活卷组:# varyonvg <vgname>
4). 在支持并发的卷组上创建逻辑卷
可以在卷组上创建逻辑卷,并指定逻辑卷镜像以提供数据冗余。
要在源节点上在支持并发的卷组上创建逻辑卷,可以执行以下步骤:
1. 使用 SMIT 快速路径 smit cl_conlv。
2. 以逻辑分区数量的形式指定逻辑卷大小。
3. 为其他可用选项指定所需的值。
4. 按 Enter 键。
5). Varyoff 卷组
在创建逻辑卷以后,使用 varyoffvg 来 Varyoff 该卷组,以便 HACMP 脚本能够启用该卷组。输入:# varyoffvg <vgname>
在 HACMP 资源组中定义一个并发卷组
要在所有节点上同时启动该并发卷组,可以在 HACMP 的启动脚本中指定卷组名称。在集群启动时,可以发现该并发卷组在所有已配置的节点上被激活。
3.5.3 增强并发模式 (ECM) VG
使用 HACMP V5.1,现在能够创建和使用增强并发 VG。这些卷组可同时用于并发和非并发访问。还可以使用 C-SPOC 将现有的并发(传统)卷组转换为增强并发模式。
对于在非并发环境中使用的增强并发卷组,与使用 SCSI 保留机制不同,HACMP V5.1 使用快速磁盘接管机制来确保快速接管和数据完整性。
注意:HACMP V5.1 中的快速磁盘接管仅在 AIX 5L V5.2 中可用。
ECM 卷组在集群中属于该资源组的所有节点上 Varyon 。但是,只有已激活该资源组(在线)的节点才被授权进行用于修改数据的访问。
3.5.3.1 ECM 中的主动和被动 Varyon
增强并发卷组能够以两种模式在节点上变为活动或 Varyon 状态:主动或被动。
(1)主动 Varyon
在主动状态下,允许进行所有高级操作。当在节点上以主动状态启用某个增强并发卷组时,该卷组允许执行以下操作:
(1). 文件系统操作,例如文件系统挂载
(2). 应用程序操作
(3). 逻辑卷操作,例如创建逻辑卷
(4). 同步卷组
(2)被动 Varyon
当以被动状态启用某个增强并发卷组时,LVM 在 LVM 级别为该卷组提供等效的 Fencing。
以被动模式启用该 VG 的节点只允许在该卷组上执行有限数量的只读操作。
(1). 对该卷组的特殊文件的 LVM 只读访问
(2). 对该卷组拥有的所有逻辑卷的前 4KB 的 LVM 只读访问
当以被动模式启用某个卷组时,不允许执行下列操作:
(1). 文件系统操作,例如装入
(2). 逻辑卷上的任何打开或写入操作
(3). 同步卷组
3.5.3.2 创建增强并发访问卷组
1. 在 AIX 5L 5.1 及更高版本上创建并发卷组时,将会自动以增强并发模式创建这些卷组。
2. 要从 AIX 命令行创建支持并发的卷组,可以使用 mkvg 命令。例如:
# mkvg -n -s 32 -C -y myvg hdisk11 hdisk12
将在 hdisk11 和 hdisk12 上创建一个增强并发 VG。其中的标志指定以下特征:
-n 不要在启动时启用该 VG。
-s 32 指定 32 MB 的分区大小。
-C 创建一个增强并发 VG。
-y 指定 VG 名称。
3.5.3.3 快速磁盘接管
这是 HACMP V5.1 的一个新功能,并具有下列主要用途:
(1). 减少应用程序停机时间,实现更快的资源组故障转移(和移动)
(2). 对卷组的并发访问(保护数据完整性)
(3). 使用 AIX 增强并发 VG (ECM)
(4). 使用 RSCT 进行通信
增强并发卷组支持主动和被动模式的 Varyon,并且可以包括在非并发资源组中。
快速磁盘接管由 HACMP 软件自动进行设置。对于以增强并发模式创建并包含文件系统的所有共享卷组,HACMP 将激活快速磁盘接管功能。当 HACMP 启动时,资源组中共享同一个增强并发卷组的所有节点将以被动模式 Varyon 该卷组。当将该资源组置于在线时,获取资源的节点将以主动模式 Varyon 该卷组。
其他节点将维持该卷组的被动模式启用状态。在此情况下,对该卷组的所有更改都将自动传播到该卷组中的所有节点。在集群启动、资源组激活和故障转移以及在故障节点重新加入集群时,从主动到被动模式的改变以及反向改变由 HACMP 进行协调。
此功能的先决条件包括:
(1). HACMP V5.1
(2). AIX 5L 5.2 或更高版本
(3). bos.clvm.5.2.0.11 或更高版本
(4). APAR IY44237
有关快速磁盘接管的更多信息,请参见 HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02。
FROM:
HACMP 认证学习系列,第 3 部分:安装和配置(1)
http://www.ibm.com/developerworks/cn/aix/redbooks/HACMP-3/1.html
------------------------------------------------------------------------------
Blog: http://blog.csdn.net/tianlesoftware
网上资源: http://tianlesoftware.download.csdn.net
相关视频:http://blog.csdn.net/tianlesoftware/archive/2009/11/27/4886500.aspx
DBA1 群:62697716(满); DBA2 群:62697977(满)
DBA3 群:62697850 DBA 超级群:63306533;
聊天 群:40132017
--加群需要在备注说明Oracle表空间和数据文件的关系,否则拒绝申请