IBM HACMP 系列 -- 后期安装工作和管理任务二

 

本部分介绍如何在 HACMP 集群中管理资源组。

 

一些最常见的操作包括:

1.        在节点之间移动资源组

2.        添加和删除资源组

3.        修改资源组(添加和删除资源)

4.        配置资源组处理顺序

5.        配置资源组运行时参数(计时器等)

 

HACMP V5.1 包括一些用于操作资源组的新特性。这些新特性包括:

1.        资源组管理实用工具

2.        用资源组的优先级覆盖位置替换 STICKY 属性。

3.        资源组停留计时器

4.        定时退回资源组

 

. 资源组移动

HACMP V5.1 中,DARE 资源迁移工具已被资源组管理实用工具所取代。

 

新的资源组管理实用工具 (clRGmove) 使用户能够执行以下操作:

1.        将资源组置于在线

2.        将资源组置于离线

3.        将资源组移动到其他节点

 

       clRGmove 命令运行时,会将 rg_move 事件放置到队列中用于执行所请求的操作。执行上述任一操作都会对资源组的优先级覆盖位置 (POL) 进行设置。

 

. 优先级覆盖位置 (POL)

       在以前的 HACMP 版本中,管理资源组位置需要资源重新配置事件 (cldare -M)

       资源组位置可能会由于各种原因而改变,但是这一位置在维护操作期间特别有用。资源组发生移动(移动是手动启动的)后,我们需要确保资源组保持其状态不变(指定的节点和状态)。

       以前,在 HACMP V4.5 中遇到这种情况时,我们使用 STICKY 属性来指定资源组行为。用户很难理解 STICKY 资源组属性的用法。此外,即使资源组被移动了,它仍会自动返回其缺省位置。

 

HACMP V5.1 引入了新的资源组管理机制——clRGmove 实用工具。

1.        clRGmove 告诉集群管理器将 rg_move 事件放置到队列中。

2.        与旧的 DARE 方法相比,这些 rg_move 事件的执行速度更快。

3.        资源组位置更易于管理和理解。

4.        事件处理更简单并特定于资源组移动。

 

HACMP V4.5 使用 STICKY 资源组属性来维护资源组的位置和/或状态:

1.        客户使用 DARE 移动、启动或停止资源组时会对 STICKY 属性进行设置。

2.        如果对 STICKY 属性进行了设置,则在集群重新启动过程中资源组状态将保持不变。

3.        如果未对 STICKY 属性进行设置,则已被移动、启动或停止的资源组会移动到具有更高优先级的节点。

 

HACMP V5.1 使用优先级覆盖位置 (POL) 设置来维护资源组的位置和/或状态:

1.        在正常运行条件下,资源组没有 POL

2.        如果系统管理员/用户对资源组启动手动操作(将其置于在线、离线,或将其移动到另一个节点),则资源组将获得 POL 属性。

3.        POL 指所请求的资源组的状态(在线/离线)和位置(在手动操作过程中指定)。

4.        用户可以指定一个具有持久性的 POL,也就是说当集群在所有节点上重新启动时 POL 应保持不变。

5.        POL 决定了资源组行为具有以下特点:

6.        具有 POL 的离线资源组将保持离线。

7.        除非取消 POL,否则它将一直有效。

8.        只要还有一个集群节点处于活动状态,非持久性 POL 就将保持有效。

9.        如果集群中所有节点上的 HACMP 守护进程都关闭,则非持久性 POL 将被隐式取消。

 

       在执行资源组管理时,您应始终使用 POL。如果资源组上未设置 POL,则即使集群中具有最高优先级的节点失败,您也可以将资源组中的任何其他节点置于在线。

    例如,在一个由四个节点组成的集群中,如果为在一个节点上执行维护而“正常”停止了集群服务(例如,同一资源组中的另一个节点失败),则资源组将被其他可用节点获取(因为在执行集群重新配置时会发现此资源组离线)。

    我们可以通过在具有最高优先级(且已“正常”关闭)的节点上为该资源组设置 POL,来避免获取不希望的资源组。即使集群服务停止,此 POL 也将继续有效。

    使用 SMIT 面板移动资源组时,还可以指定在集群重新启动时保持资源组状态和位置不变。如果您将此标记保留为缺省设置 (false),则您指定的目的地节点不会成为资源组的 POL,并且当您在所有节点上停止并重新启动集群服务(集群重新启动)之后,资源组将退回到其缺省行为。

       如果将此标记设置为 true(在集群重新启动时保持不变),则资源组的目的地节点和状态会成为此资源组的 POL。也就是说,一旦将资源组移动到指定的目的地节点,在集群重新启动后,它仍将在该节点上。

 

示例 1 设置持久性 POL

Move a Resource Group

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[Entry Fields]

Resource Group to be Moved customrg

Destination Node p630n02

Persist Across Cluster Reboot? true +

F1=Help F2=Refresh F3=Cancel F4=List

F5=Reset F6=Command F7=Edit F8=Image

F9=Shell F10=Exit Enter=Do

结果应该与示例 2 类似。

 

示例 2 设置 POL

[Entry Fields]

customrg p630n02

true +

F4=List

F8=Image

COMMAND STATUS

Command: OK stdout: yes stderr: no

Before command completion, additional instructions may appear below.

Attempting to move group customrg to node p630n02.

Waiting for cluster to process the resource group movement request.....

Waiting for the cluster to stabilize.......

Resource group movement successful.

 

Resource group customrg is online on node p630n02.

Distributing persistent priority override location information to all accessible nodes.

-----------------------------------------------------------------------------

Group Name Type    State  Location Priority Override

-----------------------------------------------------------------------------

customrg   custom OFFLINE p630n01  p630n02 (PERSISTENT)

                  ONLINE  p630n02  p630n02 (PERSISTENT)

F1=Help F2=Refresh F3=Cancel F6=Command

F8=Image F9=Shell F10=Exit /=Find n=Find Next

 

要验证此操作是否成功,可以使用 clRGinfo 命令(请参见示例 3)。

 

示例 3 clRGinfo -p 命令

[p630n01]/usr/es/sbin/cluster/utilities/clRGinfo -p

-----------------------------------------------------------------------------

Group Name  Type    State   Location Priority Override

-----------------------------------------------------------------------------

rg01      cascading  ONLINE  p630n01

                     OFFLINE p630n02

                     OFFLINE p630n03

>>>>>>>>>>>>>> Omitted lines <<<<<<<<<<<<<<

rg05      cascading  OFFLINE p630n01 OFFLINE (PERSISTENT)

                     OFFLINE p630n02 OFFLINE (PERSISTENT)

                     OFFLINE p630n03 OFFLINE (PERSISTENT)

>>>>>>>>>>>>>> Omitted lines <<<<<<<<<<<<<<

customrg   custom    OFFLINE p630n01 p630n02 (PERSISTENT)

                     ONLINE p630n02 p630n02 (PERSISTENT)

 

       如果设置了 POL 位,则这一设置将存储在 /usr/es/sbin/cluster/etc/clpol 文件中。如果未对此位进行设置,则该文件将为空。

       此文件中的数据是以数字形式表示的,通常不允许最终用户查看或更改。但是,您可以清除非活动集群上的所有持久性 POL,方法很简单,只需清空每个节点上的 clpol 文件即可(请参见示例 4)。

 

示例 4 清空 POL 文件

[p630n01] /# > /usr/es/sbin/cluster/etc/clpol

 

文件的格式为 [RG id] [node id] [POL] [persistent?](请参见示例 5)。

示例 5 clpol 文件

[p630n01][/]> pg /usr/es/sbin/cluster/etc/clpol

5 1 2 1 // RG 5 is OFFILINE PERSISTENT on node 1

5 2 2 1 // RG 5 is OFFILINE PERSISTENT on node 2

5 3 2 1 // RG 5 is OFFILINE PERSISTENT on node 3

7 2 1 1 // RG 7 is ONLINE PERSISTENT on node 2

[p630n01][/]>

 

恢复节点优先级顺序

       可以使用 SMIT 菜单中的 Restore_Node_Priority_Order 属性恢复资源组的初始节点优先级顺序(请参见示例 6)。

       这一选择还会删除以前为资源组设置的任何持久性优先级覆盖位置。此外,它还会恢复资源组的节点优先级顺序,以便资源组可以移动到当前可用的具有最高优先级的节点。

 

示例 6 恢复节点优先级

Move a Resource Group

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[Entry Fields]

Resource Group to be Moved customrg

Destination Node Restore_Node_Priority>

Persist Across Cluster Reboot? false +

F1=Help F2=Refresh F3=Cancel F4=List

F5=Reset F6=Command F7=Edit F8=Image

F9=Shell F10=Exit Enter=Do

注意:Restore_Node_Priority_Order 仅适用于非并发资源组。

 

 

. 更改资源组

       在利用集群的过程中,可能需要更改资源和资源组。虽然更改资源组定义可以实现上述目标,但是最常用的操作可能是修改资源组中的内容(资源)。

       可以通过 SMIT 菜单,使用标准或扩展配置实现此目标。在标准菜单中,可对资源组做的更改是有限的,而在使用扩展菜单时,可以对资源和资源组行为进行微调。

       本部分介绍了使用 HACMP Extended SMIT 菜单更改资源组组合、行为和属性的一些示例。

 

       要更改资源,请运行 smitty hacmp 并选择 Extended Configuration Extended Resource Configuration(请参见示例 7)。

 

示例 7 更改资源组(扩展)

Extended Resource Configuration

Move cursor to desired item and press Enter.

HACMP Extended Resources Configuration

Configure Resource Group Run-Time Policies

HACMP Extended Resource Group Configuration

F1=Help F2=Refresh F3=Cancel F8=Image

F9=Shell F10=Exit Enter=Do

 

选择 Change/Show Resources and Attributes for a Resource Group 选项(请参见示例 5-20)。

示例 8 资源组属性菜单

HACMP Extended Resource Group Configuration

Move cursor to desired item and press Enter.

Add a Resource Group

Change/Show a Resource Group

Change/Show Resources and Attributes for a Resource Group

Remove a Resource Group

Show All Resources by Node or Resource Group

F1=Help F2=Refresh F3=Cancel F8=Image

F9=Shell F10=Exit Enter=Do

 

选择要更改的资源组,然后按 Enter(请参见示例 9)。

示例 9 资源组选择

 

现在您可以修改资源组特性(请参见示例 10)。

示例 10 更改资源组属性

Change/Show All Resources and Attributes for a Custom Resource Group

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[TOP] [Entry Fields]

Resource Group Name customrg

Resource Group Management Policy custom

Inter-site Management Policy ignore

Participating Node Names (Default Node Priority) p630n01 p630n02

Startup Behavior Online On Home Node O>

Fallover Behavior Fallover To Next Prio>

Fallback Behavior Fallback To Higher Pr>

Fallback Timer Policy (empty is immediate) [customofallb] +

Service IP Labels/Addresses [] +

Application Servers [] +

Volume Groups [customvg] +

Use forced varyon of volume groups, if necessary false +

 

Automatically Import Volume Groups false +

Filesystems (empty is ALL for VGs specified) [] +

Filesystems Consistency Check fsck +

Filesystems Recovery Method sequential +

Filesystems mounted before IP configured false +

Filesystems/Directories to Export [] +

+

Filesystems/Directories to NFS Mount [] +

Network For NFS Mount [] +

Tape Resources [] +

Raw Disk PVIDs [] +

Fast Connect Services [] +

Communication Links [] +

Primary Workload Manager Class [] +

Secondary Workload Manager Class [] +

Miscellaneous Data []

F1=Help F2=Refresh F3=Cancel F4=List

F5=Reset F6=Command F7=Edit F8=Image

F9=Shell F10=Exit Enter=Do

 

3.1  配置资源组处理顺序

       此功能在具有以下特征的集群中非常有用:具有多个相互依赖的应用程序服务器,且这些服务器应按特定顺序启动和停止。

       缺省情况下,HACMP 以并行方式获取和释放资源组。如果您从 HACMP 之前的版本迁移到 V4.5,则处理顺序可能仍保留为按字母顺序。

 

HACMP V5.1 中资源组的获取将按以下顺序进行:

1.        按指定的串行顺序获取指定有自定义顺序的资源组。

2.        同样按指定的顺序获取必须仅包含 NFS 文件系统的资源组。

3.        以并行方式获取未包括在自定义顺序列表中的资源组。

 

HACMP V5.1 中资源组的释放将按以下顺序进行:

1.        以并行方式释放未指定自定义顺序的资源组。

2.        HACMP 释放包括在自定义释放顺序列表中的资源组。

3.        按指定的顺序释放必须卸载 NFS 文件系统的资源组。

 

3.2  串行处理

1.        您必须用一种能防止资源组间产生依赖关系的方式来定义资源组。

2.        您应在集群中的所有节点上指定相同的自定义串行处理顺序。为完成此任务,您需要在一个节点上指定此顺序,然后对集群资源进行同步以将这一更改普及到集群中的其他节点。

3.        如果您为资源组指定了一种串行处理顺序,并且在获取(node_up 事件)或释放(node_down 事件)执行期间一些资源组中发生了 NFS 交叉挂载,则 HACMP 将自动选择首先对列表中的其他资源组进行处理,然后再处理这些资源组。

4.        如果您删除了一个已包括在自定义串行顺序列表中的资源组,则系统会自动将该资源组的名称从此处理顺序列表中删除。如果您更改某个资源组的名称,此列表将相应地进行更新。

 

3.3  并行处理

       无法并行处理定义了站点的资源组。确保这些资源组是以自定义串行顺序指定的。

       如果在某一时间点您决定将顺序处理顺序更改为并行处理,而此时您已为特定的集群事件配置了事件前和事件后脚本,则您可能需要更改这些脚本,因为这些脚本可能已不再生成预期的结果。

       要更改资源组处理顺序,请运行 smitty hacmp 并选择 Extended Configuration Configure Resource Group Run-Time Policies(请参见示例 11)。

 

示例 11 资源组处理顺序

Configure Resource Group Run-Time Policies

Move cursor to desired item and press Enter.

 

Configure Resource Group Processing Ordering

Configure Dynamic Node Priority Policies

Configure HACMP Workload Manager Parameters

Configure Delayed Fallback Timer Policies

Configure Settling Time for Resource Groups

F1=Help F2=Refresh F3=Cancel F8=Image

F9=Shell F10=Exit Enter=Do

 

为资源组键入新的处理顺序(请参见示例 12)。

示例 12 更改处理顺序

Change/Show Resource Group Processing Order

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[Entry Fields]

Resource Groups Acquired in Parallel customrg rg01 rg02 rg>

Serial Acquisition Order

New Serial Acquisition Order [rg02 customrg rg01] +

Resource Groups Released in Parallel customrg rg01 rg02 rg>

Serial Release Order

New Serial Release Order [rg01 customrg rg02] +

F1=Help F2=Refresh

F5=Reset F6=Command

F9=Shell F10=Exit

F3=Cancel F4=List

F7=Edit F8=Image

Enter=Do

 

. 创建新资源组

       在通过其他应用程序扩展集群功能时,可能需要添加新资源组。可以使用 HACMP 标准或扩展菜单添加新资源组,而本部分中我们介绍的做法是使用扩展配置路径。

       要添加新资源组,请运行 smitty hacmp 并选择 Extended Configuration Extended Resource Configuration HACMP Extended Resource Group Configuration -> Add a Resource Group

      

       键入新资源组的名称,然后选择可以“存放”此资源组的节点及其他任何参数。我们建议您对所有新资源组使用“custom”类型(除非需要替换 IPAT 时)。

 

选择资源组行为(请参见示例 15)。

示例 15 资源组行为

Add a Custom Resource Group (extended)

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[Entry Fields]

* Resource Group Name [db_rg]

Inter-Site Management Policy [ignore] +

* Participating Node Names (Default Node Priority) [p630n01 p630n02 p630n> +

Startup Policy Online On Home Node O> +

Fallover Policy Fallover To Next Prio> +

Fallback Policy Fallback To Higher Pr> +

F1=Help F2=Refresh F3=Cancel F4=List

F5=Reset F6=Command F7=Edit F8=Image

F9=Shell F10=Exit Enter=Do

 

       请记住,在添加资源组时,您需要做的实际上只是定义一个需要用实际资源(服务 IP 地址、卷组、文件系统、应用程序服务器等)进行“填充”的“容器”。要激活资源组,必须为此资源组“填充”上资源,并且必须对集群进行同步。

       可以在集群服务正常运行时添加资源组。对集群进行同步 (DARE) 时,资源组将在指定的节点上变为在线。

 

. 将资源组置于在线

       HACMP 服务在集群中的所有节点上启动时会将资源组置于在线,前提是优先级覆盖位置 (POL) 未设置,或设置为允许将资源组置于在线。

       在试图将资源组置于在线之前,应首先验证此资源组是否处于离线状态。如果它已处于在线状态,则无法将其置于在线。如果它处于错误状态,则可能需要采取纠正措施。要验证资源组状态,请使用 clRGinfo 命令(请参见示例 16)。

 

示例 16 检查资源组状态

[p630n01]/usr/es/sbin/cluster/utilities/clRGinfo

Group Name Type State Location customrg custom OFFLINE p630n01

OFFLINE p630n02

 

       要将资源组置于在线,请运行 smitty cl_admin 并选择 HACMP Resource Group and Application Management Bring a Resource Group Online(请参见示例 17)。

 

示例 17 资源组管理菜单

HACMP Resource Group and Application Management

Move cursor to desired item and press Enter.

 

Bring a Resource Group Online

Bring a Resource Group Offline

Move a Resource Group to Another Node

Suspend/Resume Application Monitoring

Application Availability Analysis

F1=Help F2=Refresh F3=Cancel F8=Image

F9=Shell F10=Exit Enter=Do

 

       选择要置于在线的资源组,以及将在其上激活该资源组的节点。所选节点将成为优先级覆盖位置(请参见示例 18)。

注意:只能对处于离线和错误状态的资源组执行此操作。

 

示例 18 选择要置于在线的资源组

Bring a Resource Group Online

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

 

[Entry Fields]

Resource Group to Bring Online customrg

Destination Node p630n01

Persist Across Cluster Reboot? false +

F1=Help F2=Refresh F3=Cancel F4=List

F5=Reset F6=Command F7=Edit F8=Image

F9=Shell F10=Exit Enter=Do

 

检查 SMIT 输出以确认操作是否成功(请参见示例 19)。

示例 19 SMIT 状态屏幕

COMMAND STATUS

Command: OK stdout: yes stderr: no

Before command completion, additional instructions may appear below.

Attempting to bring group customrg online on node p630n01.

Waiting for cluster to process the resource group movement request.....

Waiting for the cluster to stabilize.....

Resource group movement successful.

Resource group customrg is online on node p630n01.

Group Name Type State Location Priority Override customrg custom ONLINE p630n01 p630n01

OFFLINE p630n02 p630n01

F1=Help F2=Refresh F3=Cancel F6=Command

F8=Image F9=Shell F10=Exit /=Find n=Find Next

 

有关其他消息,请参阅 /tmp/clstrmgr.debug 文件(请参见示例 20)。

示例 20 clstrmgr.debug 中的资源组状态

Thu Jul 1 12:35:28 RpcPoll: RESMGR RPC request made!

Thu Jul 1 12:35:28 got rginfo request.

Thu Jul 1 12:35:28 getting resource group info for customrg

Thu Jul 1 12:35:28 request was successful.

Thu Jul 1 12:35:28 group customrg has 2 nodes

...

Thu Jul 1 12:35:28 node p630n01 (1) state 4 pol 2 pers 0 pol_secondary 0

pers_secondary 0

Thu Jul 1 12:35:28 Querying the Timer status for customrg

Thu Jul 1 12:35:28 getGroupTimers: ENTER

getGroupTimers: Processing customrg group

Thu Jul 1 12:35:28 No timers currently active for this group.

Thu Jul 1 12:35:28 node p630n02 (2) state 4 pol 2 pers 0 pol_secondary 0

pers_secondary 0

Thu Jul 1 12:35:28 Querying the Timer status for customrg

 

Thu Jul 1 12:35:28 getGroupTimers: ENTER

getGroupTimers: Processing customrg group

Thu Jul 1 12:35:28 No timers currently active for this group.

...

********************

* RG STATE TABLE *

********************

Thu Jul

Thu Jul

...

Thu Jul

Thu Jul

Thu Jul

Thu Jul

Thu Jul

Thu Jul

...

Thu Jul

Thu Jul

Thu Jul

...

Thu Jul

1 12:38:30 GROUP:[customrg] NODE:[p630n01] STATE:[4]

1 12:38:30 GROUP:[customrg] NODE:[p630n02] STATE:[4]

1 12:38:30 group=customrg, node=p630n01

1 12:38:30 secondary priority=1

1 12:38:30 group=customrg, node=p630n01, state=4

1 12:38:30 group=customrg, node=p630n02

1 12:38:30 secondary priority=2

1 12:38:30 group=customrg, node=p630n02, state=4

1 12:40:04 Enter - RevisitRGStates

1 12:40:04 Resetting customrg to 16 on p630n01

1 12:40:04 Resetting customrg to 4 on p630n02

1 12:40:04 node p630n01 (1) state 16 pol 1 pers 0 pol_secondary 0

pers_secondary 0

Thu Jul 1 12:40:04 Querying the Timer status for customrg

 

/tmp/hacmp.out 文件还包含资源组启动的事件和流程条目(请参见示例 21)。

示例 21 /tmp/hacmp.out 消息

Jul 1 12:39:58 EVENT START: rg_move_acquire p630n01 7

Jul 1 12:39:58 EVENT START: rg_move p630n01 7 ACQUIRE

Jul 1 12:39:59 EVENT START: node_up_local

...

customrg:node_up_local[15] clchdaemons -d clstrmgr_scripts -t resource_locator

-n p630n01 -o customrg -v ACQUIRING

customrg:node_up_local[15] [[ ACQUIRING = ACQUIRING ]]

customrg:node_up_local[15] [[ NONE = ACQUIRE_SECONDARY ]]

customrg:node_up_local[15] [[ NONE = PRIMARY_BECOMES_SECONDARY ]]

customrg:node_up_local[34] cl_RMupdate acquiring customrg node_up_local

Reference string: Thu.Jul.1.12:39:59.EDT.2004.node_up_local.customrg.ref

...

 

. 将资源组置于离线

       当您在某个节点上手动将资源组置于离线时,该节点将成为此资源组的优先级覆盖位置 (POL)。有关更多信息,请参见第 215 页上的 5.2.2“优先级覆盖位置 (POL)”。

       如果 Persist Across Cluster Reboot 设置为 true,则即使集群在所有节点上重新启动,资源组也将保持离线。

       无法使将资源组置于离线与取消优先级位置同时进行。

       对于非并发资源组,POL 对资源组中的所有节点均设置为离线。如果您想将并发资源组完全置于离线(或在线),请将 ALL_Nodes_in_Group 选为节点。

       注意:只能对处于在线和错误状态的资源组执行此操作。

 

       在将资源组置于离线之前,您应验证此资源组是否处于在线或错误状态(请参见示例 16)。

 

       要将资源组置于离线,请运行 smitty cl_admin 并选择 HACMP Resource Group and Application Management Bring a Resource Group Offline

 

       选择要置于离线的资源组,以及所需的节点(并发资源组的所有节点)(请参见示例 22)。

示例 22 资源组选择

Bring a Resource Group Offline

Type or select values in entry fields.

Press Enter AFTER making all desired changes.

[Entry Fields]

Resource Group to Bring Offline customrg

Node On Which to Bring Resource Group Offline p630n01

Persist Across Cluster Reboot? false +

F1=Help F2=Refresh F3=Cancel F4=List F5=Reset F6=Command

F7=Edit F8=Image F9=Shell F10=Exit Enter=Do

 

检查 SMIT 输出屏幕以验证操作是否成功(请参见示例 23)。

示例 23 SMIT 输出屏幕——将资源组置于离线

COMMAND STATUS

Command: OK stdout: yes stderr: no

Before command completion, additional instructions may appear below.

Attempting to bring group customrg offline on node p630n01.

Waiting for cluster to process the resource group movement request.....

Waiting for the cluster to stabilize.....

Resource group movement successful.

Resource group customrg is offline on node p630n01.

Group Name Type State Location Priority Override customrg custom OFFLINE p630n01 OFFLINE

OFFLINE p630n02 OFFLINE

F1=Help F2=Refresh F3=Cancel F6=Command F8=Image F9=Shell F10=Exit /=Find n=Find Next

 

有关其他信息,请参阅 /tmp/clstrmgr.debug and /tmp/hacmp.out 文件。

 

. 在节点之间移动资源组

       在集群操作过程中可能需要在集群节点之间执行资源组移动(用于维护目的)。

       指定的目的地节点将成为资源组的优先级覆盖位置 (POL)

       HACMP V4.X 中,此屏幕及其他资源组管理使用 cldare 实用程序。在 HACMP V5.1 中,使用新的 clRGmove 实用程序。

       可以使用 C-SPOC 菜单将非并发资源组移动到集群中的指定节点。

       注意:非并发资源组是指在某一时间点只能在单个节点上处于活动(在线)状态的资源组。

 

       在移动资源组之前,您应验证资源组状态。资源组应在线。无法移动处于离线或错误状态的资源组(要检查资源组状态,请参见示例 16)。

       要移动资源组,请运行 smitty cl_admin 并选择 HACMP Resource Group and Application Management Move a Resource Group to Another Node

       选择一个在线资源组以及要将其移动到的活动节点。此新节点将成为该资源组的 Priority Override。如果资源组有之前设置的 Priority Override,请选择 Restore_Node_Priority_Order 清除此 POL,使资源组返回其缺省位置。

 

注意:只能对处于在线状态的资源组执行此操作。

 

       选择要移动的资源组,检验 SMIT 状态屏幕以查看操作是否成功(请参见示例 24)。

示例 24 SMIT 状态屏幕——移动资源组

COMMAND STATUS

Command: OK stdout: yes stderr: no

Before command completion, additional instructions may appear below.

Attempting to move group customrg to node p630n02.

Waiting for cluster to process the resource group movement request.....

Waiting for the cluster to stabilize.......

Resource group movement successful.

Resource group customrg is online on node p630n02.

Group Name Type State Location Priority Override customrg custom OFFLINE p630n01 p630n02

ONLINE p630n02 p630n02

F1=Help F2=Refresh F3=Cancel F6=Command

F8=Image F9=Shell F10=Exit /=Find

 

要了解其他信息和问题确定,请参见 /tmp/hacmp.out /tmp/clstrmgr.debug 文件。

 

使用 clRGinfo 命令

       在之前的 HACMP 版本中,用于查找有关资源组状态的信息的命令是 clfindres。此命令已被 clRGinfo 命令所取代,后者将返回有关一个或多个指定资源组的位置和状态的报告。资源组可以为下列状态之一(如果配置有站点,则会有更多种可能的状态):

Online 资源组当前在集群中的一个或多个节点上正常运行。

Offline 资源组未在集群中运行,且当前未处于错误状态。

Acquiring 资源组当前正被集群中的一个节点获取。

Releasing 资源组正被一个节点释放。正常情况下,从一个节点成功释放后,资源组的状态将更改为离线。

Error 资源组被报告处于错误状态。需要用户交互。

Unknown 由于失去通信或集群中的所有节点并未全部在线,无法确定资源组的当前状态。

 

 

 

 

From:

HACMP 认证学习系列,第 5 部分:后期安装工作和管理任务(2

http://www.ibm.com/developerworks/cn/aix/redbooks/HACMP-5/2.html

 

 

 

 

 

------------------------------------------------------------------------------

Blog http://blog.csdn.net/tianlesoftware

网上资源: http://tianlesoftware.download.csdn.net

相关视频:http://blog.csdn.net/tianlesoftware/archive/2009/11/27/4886500.aspx

DBA1 群:62697716(); DBA2 群:62697977()

DBA3 群:62697850   DBA 超级群:63306533;    

聊天 群:40132017

--加群需要在备注说明Oracle表空间和数据文件的关系,否则拒绝申请

posted @ 2011-01-23 16:29  hibernate我最强  阅读(181)  评论(0编辑  收藏  举报