【转】Oracle 10g RAC TAF
本人转自:http://www.cnblogs.com/future2012lg/archive/2013/10/12/3365978.html
Oracle RAC 同一时候具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移).
它指集群中不论什么一个节点
的故障都不会影响用户的使用,连接到故障节点的用户会被自己主动转移到健康节点,从用户感受而言, 是感觉不到这样的切换。
Oracle 10g RAC 的Failover 能够分为3种:
1. Client-Side Connect time Failover
2. Client-Side TAF
3. Service-Side TAF
注意事项: 不能在listener.ora 文件里设置GLOBAL_NAME, 由于这个參数会禁用Connect-time Failover 和 Transparent
Application Failover.
一.Client-Side Connect Time Failover
Client-Side Connect Time Failover的含义:假设用户端tnsname 中配置了多个地址,用户发起连接请求时。会先尝试连接地址表中的第一
个地址。假设这个连接尝试失败,则继续尝试使用第二个地址,直至连接成功或者遍历了全部的地址。
这样的Failover的特点:仅仅在建立连接那一时刻起作用,也就是说。这样的Failover方式仅仅在发起连接时才会去感知节点故障,假设节点没有
反应,则自己主动尝试地址列表中的下一个地址。一旦连接建立之后,节点出现问题都不会做处理。从client的表现就是会话断开了,用户
程序必须又一次建立连接。
启用这样的Failover的方法就是在client的tnsnames.ora中加入FAILOVER=ON 条目,这个參数默认就是ON,所以即使不加入这个条目,
client也会获得这样的Failover能力。
演示样例:
VICTOR =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
(LOAD_BALANCE = yes)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = vic)
)
)
注:node01-vip。node02-vip要加入到hosts 文件里,不然可能解析不了。
二. Client-Side TAF(Transparent Application Failover)
如今的大部分流行的应用系统(如:weblogic, Jboss),都是启动时就建立若干到数据库的长连接,在应用程序整个生命周期内重用这些
连接。 而Client-Side Connet Time Failover的工作方式使它相应用程序的可用性没有太大帮助。
所以从Oracle 8.1.5 版本号仅仅有引入了新的Failover 机制—TAF。 所谓TAF,就是连接建立以后,应用系统执行过程中。假设某个实例发
生故障,连接到这个实例上的用户会被自己主动迁移到其它的健康实例上。对于应用程序而言,这个迁移过程是透明的。不须要用户的介
入,当然。这样的透明要是有引导的。由于用户的未提交事务会回滚。
相对与Client-Side Connect Time Failover的用户程序中断(抛出
连接错误,用户必须重新启动应用程序)。TAF这样的方式在提高HA上有了非常大的进步。
TAF 的配置也非常easy。仅仅须要在client的tnsnames.ora中加入FAILOVER_MODE配置项。这个条目有4个子项目须要定义。
1. METHOD: 用户定义何时创建到事实上例的连接。有BASIC 和 PRECONNECT 两种可选值。
BASIC: 是指在感知到节点故障时才创建到其它实例的连接。
PRECONNECT:是在最初建立连接时就同一时候建立到全部实例的连接。当发生问题时。立马就能够切换到其它链路上。
注意:server-side TAF的failover方式无法设置为PRECONNECT。仅仅能设置为BASIC,10g,11g都是如此。所以,假设failover方式要设定
为PRECONNECT,就仅仅能使用client-side TAF。
两种方法比較: BASIC方式在Failover时会有时间延迟,PRECONNECT方式尽管没有时间延迟,可是建立多个冗余连接会消耗很多其它资源,
两者就是是用时间换资源和用资源换时间的差别。
2. TYPE: 用于定义发生问题时对完毕的SQL 语句怎样处理,当中有2种类型:session 和select.
这2种方式对于未提交的事务都会自己主动回滚,差别在于对select 语句的处理。对于select,用户正在运行的select语句会被转移到新的实例
上,在新的节点上继续返回兴许结果集,而已经返回的记录集则抛弃。
如果用户正在节点1上运行查询。整个结果集共同拥有10000条记录,如今已从节点1上返回9000条记录。这时节点1宕机,用户连接被转移到节
点2上,假设是session模式,则须要又一次运行查询语句;假设是select方式,会从节点2上继续返回剩下的1000条记录。而已经从节点1返
回的9000条记录不会反复返回给用户。对于用户而言。感受不到这样的切换。
显然为了实现select 方式,Oracle 必须为每一个session保存很多其它的内容,包含游标,用户上下文等,须要很多其它的资源也是用资源换时间
的方案。
3. DELAY 和 RETRIES: 这2个參数分别代表重试间隔时间和重试次数。
演示样例:
DCSRV =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
(LOAD_BALANCE = yes)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = dcsrv)
(FAILOVER_MODE =
(TYPE = SELECT)
(METHOD = BASIC)
(RETRIES = 180)
(DELAY = 5)
)
)
)
三. Service-Side TAF
Service-SideTAF 能够看作是TAF的一种变种,首先Service-SideTAF也是TAF,全部TAF的特点它都有。其次这样的TAF是在server上配
置的,而不像TAF是在client配置的。
Client-Side TAF 是在client改动tnsnames.ora 文件来配置的。假设有非常多client使用这个数据库。那么每次微小调整都须要把全部的
计算机更改一遍,既低效又easy出错。
而Service-Side TAF 通过结合Service。在数据库里保存FAIL_MODE的配置,把全部的TAF配置
保存在数据字典中。从而省去了client的配置工作,如今client的TNS文件就不须要不论什么TAF的配置选项了。
从配置參数而言。Service-Side TAF和TAF 相比多了一个Instance Role(实例角色)的概念。 所谓的实例角色,就是当有多个Instance
參
与一个Service时,能够配置优先使用哪一个Instance为用户提供服务。用户共同拥有两种可选角色。
PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。
AVAILABLE: 后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE
的Instance上。
要使用Server-Side TAF。第一步,必须配置Service。 Service 能够在创建数据库时创建,也能够在创建数据库之后改动,既能够使用
dbca 配置向导,也能够用命令行的 方式配置。第二步。必须通过dbms_service包来配置TAF策略选项。
注意:server-side的TAF策略会覆盖掉client-side的TAF策略,所以假设使用client-side TAF连接数据库而不想使用server-side的策略。
就仅仅能使用另外一个service。
3.1 用DBCA 配置Service
1). 执行DBCA。选择ORACLE RAC Application Clusters database
2). 在第二个界面选择:Services Management
3). 第三个界面会出现RAC 数据库列表。用户能够在这个列表中选择要配置Service 的数据库
4). 在Serice配置界面中,单击Add 创建新的Service,输入service名字。
在Instance列表框定义实例角色,选择那个service1 作为
Preferred(首选实例)。Service2 作为availiable(后备实例)。
TAF Policy有三个选项: None。 Basic,Pre-connect。 我们选Basic。
最
后点击Finish,完毕Service 配置。
5)在结束Service配置后,服务会自己主动启动。
3.2 用srvctl 命令配置Service
用命令行方式配置Service 对远程维护非常实用。 先来看一下相关命令
1) 创建service
#Srvctl add service -d <database-name> -s <service-name> -r "preferred-instance-list"
-a "available-instance-list" -P <TAF-policy>
当中TAF-Policy可选:basic 和 preconnect。 比如:
srvctl add service -d RAC -s Service2 -r "RAC1,RAC2" -a "RAC3,RAC4" -P basic
注意:srvctl add service中,仅仅有perferred才会创建服务。
即在OCR中注冊一个ora.vic.dcsrv.vic1.Srv的服务。
2) 查看配置信息
#srvctl config service -d database-name [-s service-name] [-a]
假设这里不指定"-s service-name",就会显示全部Service的配置。这些配置包含preferred 和available instance. 使用-a
选项。还会显示
TAF 相关信息。
3) 是否自己主动执行service
数据库启动时,会自己主动启动全部的Service。有时为了为了维护须要。须要禁用这个特性,在维护完毕后再启动这个特性。
#srvctl enable/disable service -d database-name -s service-name -i instance-name
4)启动service
#srvctl start service -d <database-name> -s <service-name> -i instance-name -o start-option
-c connect-string -q
假设不指定service-name, 则全部的service 都会被启动,能够使用逗号分隔方式,同一时候启动多个service。
-i 指定在那个实例上启动service。
5) 停止service
#srvctl stop service -d <database-name> -s <service-name> -i instance-name -c connect-string
-q -f
当中-f 选项能够强制关闭service,并中断了其全部用户的连接。
6) 查看service 状态
#srvctl status service -d <database-name> -s service-name -i instance-name -f -v
当中-f 能够显示被disable的instance 信息。而-v 能够显示具体输出
7) 删除service
#srvctl remove service -d database-name -s service-name -i instance-name [-f]
注意:在使用srvctl 创建service时,须要注意TAF策略选项必须通过dbms_service包来配置。
演示样例:
begin
dbms_service.modify_service(
service_name='>service1',
failover_method=>dbms_service.failover_method_basic,
failover_type=>dbms_service.failover_type_select,
failover_retries=>180,
failover_delay=>5);
end;
3.3 配置Service 的注意事项
1). 数据库的服务名是用service_name 參数来指定的,一个数据库能够有多个服务名,可是service_name最长是4kb。不要手工来改动
这个參数
2)最多能够创建64个service。每一个数据库有2个隐含的service,因此留给用户的就仅仅有62个service。不能改动这两个隐含service的配
置,而且也不能手工启动或停止这2个服务。 这两个隐含的service各自是:SYS$BACKGROUND 和 SYS$USERS.
3) 当使用dbca配置Service 时,dbca 会自己主动更新OCR,启动Service, 当删除service时,会停止service。并更新OCR.
4) 使用srvctl 这个工具时。命令仅仅更新OCR中的配置,不会更新data dctionary 和 listener 中的信息,因此还须要使用dbma_servie
包来更
新data dictionary。手工更改listener配置文件。 故推荐使用DBCA工具来配置更改service配置
5) 假设client想通过Service 方式连接数据库。须要在tns条目中使用service_name 方式引用数据库。
如:
VICTOR =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
(LOAD_BALANCE = yes)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = vic)
)
)
注意:不管是使用dbca 工具还是使用srvctl 命令来配置service。都无法配置TAF的TYPE,DELAY,RETRIES 三个属性。必须使用
dbms_service包来改动这些属性。
配置TAF 和 Service-side TAF
client的TAF配置,仅仅需在client的TNS中加入例如以下就能够了
RAC =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.200)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.201)(PORT = 1521))
(LOAD_BALANCE=YES)
(
CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=RACDB)
(
FAILOVER_MODE= (TYPE=session/select)(METHOD=basic) (RETRIES=180)(DELAY=5)
)
)
)
配置server的TAF
加入Service-side TAF
1、检查是否配置了Service-side TAF
[grid@dou_rac2 ~]$ srvctl config service -d racdb
--无返回结果,说明没有配置service
2、检查监听中是否注冊监听了Service-side TAF 服务
[grid@dou_rac2 ~]$ lsnrctl status LISTENER_SCAN1
[oracle@rac2 admin]$ srvctl add service -d racdb -s racdb_taf -r "racdb1,racdb2" -P basic
[oracle@rac2 admin]$ crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora....B1.inst application ONLINE ONLINE rac1
ora....B2.inst application ONLINE ONLINE rac2
ora.RACDB.db application ONLINE ONLINE rac2
ora....DB1.srv application OFFLINE OFFLINE
ora....DB2.srv application OFFLINE OFFLINE
ora...._taf.cs application OFFLINE OFFLINE
ora....SM1.asm application ONLINE ONLINE rac1
ora....C1.lsnr application ONLINE ONLINE rac1
ora.rac1.gsd application ONLINE ONLINE rac1
ora.rac1.ons application ONLINE ONLINE rac1
ora.rac1.vip application ONLINE ONLINE rac1
ora....SM2.asm application ONLINE ONLINE rac2
ora....C2.lsnr application ONLINE ONLINE rac2
ora.rac2.gsd application ONLINE ONLINE rac2
ora.rac2.ons application ONLINE ONLINE rac2
ora.rac2.vip application ONLINE ONLINE rac2
配置这个服务自启动
[oracle@rac2 admin]$ srvctl enable service -d racdb -s racdb_taf
PRKP-1018 : Service racdb_taf already enabled.
启动服务
[oracle@rac2 admin]$ srvctl start service -d racdb -s racdb_taf
确认服务状态。
Online 说明已启动
[oracle@rac2 admin]$ crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora....B1.inst application ONLINE ONLINE rac1
ora....B2.inst application ONLINE ONLINE rac2
ora.RACDB.db application ONLINE ONLINE rac2
ora....DB1.srv application ONLINE ONLINE rac1
ora....DB2.srv application ONLINE ONLINE rac2
ora...._taf.cs application ONLINE ONLINE rac1
ora....SM1.asm application ONLINE ONLINE rac1
ora....C1.lsnr application ONLINE ONLINE rac1
ora.rac1.gsd application ONLINE ONLINE rac1
ora.rac1.ons application ONLINE ONLINE rac1
ora.rac1.vip application ONLINE ONLINE rac1
ora....SM2.asm application ONLINE ONLINE rac2
ora....C2.lsnr application ONLINE ONLINE rac2
ora.rac2.gsd application ONLINE ONLINE rac2
ora.rac2.ons application ONLINE ONLINE rac2
ora.rac2.vip application ONLINE ONLINE rac2
未配置前的service 名
SQL> show parameter service
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
service_names string RACDB
配置后的,新建的服务会自己主动加入到初始话參数中:
SQL> show parameter service
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
service_names string racdb_taf, RACDB
而且监听里面也有了
[oracle@rac1 ~]$ lsnrctl status
LSNRCTL for Linux: Version 10.2.0.5.0 - Production on 12-OCT-2013 21:09:04
Copyright (c) 1991, 2010, Oracle. All rights reserved.
Connecting to (ADDRESS=(PROTOCOL=tcp)(HOST=)(PORT=1521))
STATUS of the LISTENER
------------------------
Alias LISTENER_RAC1
Version TNSLSNR for Linux: Version 10.2.0.5.0 - Production
Start Date 12-OCT-2013 20:08:37
Uptime 0 days 1 hr. 0 min. 27 sec
Trace Level off
Security ON: Password or Local OS Authentication
SNMP OFF
Listener Parameter File /opt/ora10g/product/10.2.0/db_1/network/admin/listener.ora
Listener Log File /opt/ora10g/product/10.2.0/db_1/network/log/listener_rac1.log
Listening Endpoints Summary...
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.1.200)(PORT=1521)))
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=127.0.0.1)(PORT=1521)))
Services Summary...
Service "+ASM" has 1 instance(s).
Instance "+ASM1", status BLOCKED, has 1 handler(s) for this service...
Service "+ASM_XPT" has 1 instance(s).
Instance "+ASM1", status BLOCKED, has 1 handler(s) for this service...
Service "PLSExtProc" has 1 instance(s).
Instance "PLSExtProc", status UNKNOWN, has 1 handler(s) for this service...
Service "RACDB" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
Service "RACDBXDB" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
Service "RACDB_XPT" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
Service "racdb_taf" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
The command completed successfully
也能够用srvctl 命令查看配置情况
[oracle@rac1 ~]$ srvctl config service -d RACDB -s racdb_taf -a
racdb_taf PREF: RACDB1 RACDB2 AVAIL: TAF: basic
select name, failover_method, failover_type, goal, clb_goal
from dba_services;
---------------------------------------
SYS$BACKGROUND NONE SHORT
SYS$USERS NONE SHORT
RACDBXDB LONG
RACDB LONG
racdb_taf NONE LONG
用service TAF 改动配置。须要用dbms_service.modify_service包。
SQL> begin
dbms_service.modify_service(
service_name=>'racdb_taf',
failover_method=>dbms_service.failover_method_basic,
failover_type=>dbms_service.failover_type_select,
failover_retries=>180,
failover_delay=>5);
end;
/
确认參数已经生效
SYS$BACKGROUND NONE SHORT
SYS$USERS NONE SHORT
RACDBXDB LONG
RACDB LONG
racdb_taf BASIC SELECT NONE LONG
10) 删除Service
先关闭service:
[oracle@rac1 ~]$ srvctl stop service -d RACDB -s racdb_taf
[oracle@rac1 admin]$ crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora....B1.inst application ONLINE ONLINE rac1
ora....B2.inst application ONLINE ONLINE rac2
ora.RACDB.db application ONLINE ONLINE rac2
ora....DB1.srv application OFFLINE OFFLINE
ora....DB2.srv application OFFLINE OFFLINE
ora...._taf.cs application OFFLINE OFFLINE
ora....SM1.asm application ONLINE ONLINE rac1
ora....C1.lsnr application ONLINE ONLINE rac1
ora.rac1.gsd application ONLINE ONLINE rac1
ora.rac1.ons application ONLINE ONLINE rac1
ora.rac1.vip application ONLINE ONLINE rac1
ora....SM2.asm application ONLINE ONLINE rac2
ora....C2.lsnr application ONLINE ONLINE rac2
ora.rac2.gsd application ONLINE ONLINE rac2
ora.rac2.ons application ONLINE ONLINE rac2
ora.rac2.vip application ONLINE ONLINE rac2
[oracle@rac1 ~]$ srvctl disable service -d RACDB -s racdb_taf
删除服务:
[oracle@rac1 ~]$ srvctl remove service -d RACDB -s racdb_taf
dcsrv PREF: vic1 AVAIL: vic2
Service dcsrv is disabled.
Remove service dcsrv from the database vic?
(y/[n]) y
假设该命令清楚不掉。我们能够加上-f 參数
[oracle@rac2 admin]$ crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora....B1.inst application ONLINE ONLINE rac1
ora....B2.inst application ONLINE ONLINE rac2
ora.RACDB.db application ONLINE ONLINE rac2
ora....SM1.asm application ONLINE ONLINE rac1
ora....C1.lsnr application ONLINE ONLINE rac1
ora.rac1.gsd application ONLINE ONLINE rac1
ora.rac1.ons application ONLINE ONLINE rac1
ora.rac1.vip application ONLINE ONLINE rac1
ora....SM2.asm application ONLINE ONLINE rac2
ora....C2.lsnr application ONLINE ONLINE rac2
ora.rac2.gsd application ONLINE ONLINE rac2
ora.rac2.ons application ONLINE ONLINE rac2
ora.rac2.vip application ONLINE ONLINE rac2
SQL> show parameter service_names
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
service_names string RACDB
[oracle@rac1 ~]$ lsnrctl status 监听的也删除了
LSNRCTL for Linux: Version 10.2.0.5.0 - Production on 12-OCT-2013 21:29:16
Copyright (c) 1991, 2010, Oracle. All rights reserved.
Connecting to (ADDRESS=(PROTOCOL=tcp)(HOST=)(PORT=1521))
STATUS of the LISTENER
------------------------
Alias LISTENER_RAC1
Version TNSLSNR for Linux: Version 10.2.0.5.0 - Production
Start Date 12-OCT-2013 20:08:37
Uptime 0 days 1 hr. 20 min. 38 sec
Trace Level off
Security ON: Password or Local OS Authentication
SNMP OFF
Listener Parameter File /opt/ora10g/product/10.2.0/db_1/network/admin/listener.ora
Listener Log File /opt/ora10g/product/10.2.0/db_1/network/log/listener_rac1.log
Listening Endpoints Summary...
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.1.200)(PORT=1521)))
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=127.0.0.1)(PORT=1521)))
Services Summary...
Service "+ASM" has 1 instance(s).
Instance "+ASM1", status BLOCKED, has 1 handler(s) for this service...
Service "+ASM_XPT" has 1 instance(s).
Instance "+ASM1", status BLOCKED, has 1 handler(s) for this service...
Service "PLSExtProc" has 1 instance(s).
Instance "PLSExtProc", status UNKNOWN, has 1 handler(s) for this service...
Service "RACDB" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
Service "RACDBXDB" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
Service "RACDB_XPT" has 1 instance(s).
Instance "RACDB1", status READY, has 1 handler(s) for this service...
The command completed successfully
OCR中的信息已经被删除了。可是数据字典中的还有该service的内容,继续清除数据字典中的内容。
先查看数据字典内容:
select name, failover_method, failover_type, goal, clb_goal
from dba_services;
SYS$BACKGROUND NONE SHORT
SYS$USERS NONE SHORT
RACDBXDB LONG
RACDB LONG
racdb_taf BASIC SELECT NONE LONG
清除数据字典里的内容:
SQL> begin
dbms_service.delete_service(service_name=>'racdb_taf');
end;
/
再查就没有了
select name, failover_method, failover_type, goal, clb_goal
from dba_services;
SYS$BACKGROUND NONE SHORT
SYS$USERS NONE SHORT
RACDBXDB LONG
RACDB LONG