RAC集群两个节点只能启动一个节点问题处理
环境:centos7.3 、RAC11.2.3
1、问题:两个节点只能有一个节点能启动成功,另一个节点不能启动成功。查看ogg的cssd日志发现心跳问题 but no network HB
cat $ORACLE_HOME/log/lsrkzyk2/cssd/ocssd.log node 1,lsrkzyk1,has a disk HB,but no network HB,DBH has rcfg 489601250,wrtcnt......... #no network HB
2、问题处理
查看node1 和node2的IP情况
在node 上执行 ip a 发现node1的vip没有出现。
对node的 vip 进行处理
先停用然后启用网卡
nmcli device down eth4
nmcli device up eth4
发现ip启动成功,重启node2节点问题解决
3、问题:RAC启动后acfs磁盘没有自动挂载到本定,root使用命令 mount.acfs -o all 磁盘也没有挂载上
4、处理
1、查看acfs磁盘状态
grid用户 命令行登录 asmcmd 查看磁盘情况,没有识别到磁盘并且状态为disabled
2、查看acfs进程是否启动,发现没有启动进行启动 root用户 /u01/grid/11.2/bin/acfsload start -s
3、再次查看磁盘状态为正常
4、enable acfs磁盘 并挂载磁盘
volenable -G PIC_DATA PIC
mount.acf -o all
4、gric常用命令
root执行 /u01/oracle_grid/bin/crsctl stop crs -f #关闭集群 /u01/oracle_grid/bin/crsctl start crs #启动集群 /u01/oracle_grid/bin/crsctl status res -t #查看集群状态 /u01/oracle_grid/bin/crsctl check crs #查看集群状态 grid用户 crs_stat -v -t #查看集群状态 crsctl status res -t #查看集群状态 srvctl start database -d lsrkzyk #启动数据库 srvctl stop database -d lsrkzyk #关闭数据库 crsctl status resource ora.lsrkzyk.db -f #查看某个进程状态 srvctl start instance -d lsrkzyk -i lsrkzyk1 #启动某个实例 crsctl 应该是cluster control 用的,它管理的是cluster level的内容,如crsd cssd css 等进程和配置的管理 srvctl 是资源的管理,是cluster内资源的管理,比如instance asm listener vip ons gsd service .....
做一个决定,并不难,难的是付诸行动,并且坚持到底。