centos 6.7 (UDEV,、etc/hosts)安装 RAC 11.2.0.4 报错处理
环境说明:
db 11.2.0.4 os: centos 6.7 UDEV管理ASM 没有配置DNS服务器,采用/etc/hosts
报错:
1. CVU(Cluster Verification Utility)检查 CRS 的安装前环境。 (正常没有配置DNS服务器,采用/etc/hosts报错,可以忽略)
node1-> ./runcluvfy.sh stage -pre crsinst -n node1,node2 -fixup -verbose
hecking DNS response time for an unreachable node
Node Name Status
------------------------------------ ------------------------
node2 failed
node1 failed
PRVF-5636 : The DNS response time for an unreachable node exceeded "15000" ms on following nodes: node2,node1
2. shmmax大小设置不合理,调整合适大小。
相关理论:
SHMMAX参数:Linux进程可以分配的单独共享内存段的最大值。一般设置为内存总大小的一半。这个值的设置应该大于SGA_MAX_TARGET或MEMORY_MAX_TARGET的值,因此对于安装Oracle数据库的系统,shmmax的值应该比内存的二分之一大一些。
# grep MemTotal /proc/meminfo
# cat /proc/sys/kernel/shmmax
上面的命令是检查系统内存的大小,以及当前shmmax的设置。
# echo 21474836480 > /proc/sys/kernetbl/shmmax
# sysctl -w kernel.shmmax=21474836480
# echo "kernel.shmmax=21474836480" >> /etc/sysctl.conf
这是设置shmmax参数的几种方法,这三种方式都可以将shmmax设置为20G。这个参数的修改可以不重启数据库。个人推荐使用第二种sysctl命令的方式。采用第三种方式需要执行sysctl –t操作或重启,但是为了确保下次重启后设置值仍然生效,第三种方式是必不可少的。前两种方式类似alter system set scope = memory,而第三种方式则类似alter system set scope = spfile。
解决办法:
[root@node1 ~]# sysctl -w kernel.shmmax=1610612736
kernel.shmmax = 1610612736
[root@node1 ~]# echo ''kernel.shmmax=1610612736'' >> /etc/sysctl.conf
[root@node1 ~]#sysctl -p
3. 采用UDEV管理ASM正常报错,没有配置DNS服务器,采用/etc/hosts报错,可以忽略
4. 非正常报错,原因是包有问题。
当安装oracle 11204的rac的时候,安装集群软件到执行root.sh的时候,执行root.sh报错:
Failed to create keys in the OLR, rc = 127, Message:
/app/grid/product/11.2.0/bin/clscfg.bin: error while loading shared libraries: libcap.so.1: cannot open shared object file: No such file or directory
Failed to create keys in the OLR at /app/grid/product/11.2.0/crs/install/crsconfig_lib.pm line 7660.
/app/grid/product/11.2.0/perl/bin/perl -I/app/grid/product/11.2.0/perl/lib -I/app/grid/product/11.2.0/crs/install /app/grid/product/11.2.0/crs/install/rootcrs.pl execution failed
解决方法:所有节点都执行
[root@node1 yum.repos.d]# cd /lib64
[root@node1 lib64]# ln -s libcap.so.2.16 libcap.so.1
5. 非正常报错,原因不明。 (有待研究)
node1-> ./runcluvfy.sh stage -post crsinst -n node1,node2 -verbose
ERROR:
PRVG-1101 : SCAN name "scan-cluster.localdomain" failed to resolve
SCAN Name IP Address Status Comment
------------ ------------------------ ------------------------ ----------
scan-cluster.localdomain 10.100.25.100 failed NIS Entry
ERROR:
PRVF-4657 : Name resolution setup check for "scan-cluster.localdomain" (IP address: 10.100.25.100) failed
ERROR:
PRVF-4664 : Found inconsistent name resolution entries for SCAN name "scan-cluster.localdomain"
Verification of SCAN VIP and Listener setup failed
搜了一下发现老杨(yangtingkun)的文章中也提到了这个错误:
F:RHEL5.532oracle_patchyangtingkun 安装Oracle11_2 RAC for Solaris10 sparc64(二).mht
老杨在文章的最后提到:
导致这个错误的原因是在/etc/hosts中配置了SCAN的地址,尝试ping这个地址信息,如果可以成功,,则这个错误可以忽略。
我尝试ping scan ip可以ping通,所以暂时也就忽略了这个错误。
6. 没有配置DNS服务器,采用/etc/hosts报错,可以忽略
补充:
GI安装时候报错
1、缺少 pdksh-5.2.14-1.i386.rpm
解决:
在RHEL 6.4上安装Oracle 11g 数据库,在安装过程中检测包的依赖关系,发现缺少pdksh-5.2.14-1.i386.rpm这个包,在安装pdksh-5.2.14-1.i386.rpm包的过程中,发现此包和ksh包冲突,卸载ksh包,再安装完pdksh-5.2.14-1.i386.rpm包后,安装正常进行。或者系统存在 ksh 包,忽略这个报错。
2、缺少 cvuqdisk-1.0.9-1.rpm
解决:
在解压的grid/rpm目录下找到 cvuqdisk-1.0.9-1.rpm 。 用 root 安装即可。