RAC集群两个节点只能启动一个节点问题处理

环境:centos7.3 、RAC11.2.3

1、问题:两个节点只能有一个节点能启动成功,另一个节点不能启动成功。查看ogg的cssd日志发现心跳问题  but no network HB

cat $ORACLE_HOME/log/lsrkzyk2/cssd/ocssd.log 
node 1,lsrkzyk1,has a disk HB,but no network HB,DBH has rcfg 489601250,wrtcnt.........    #no network HB

2、问题处理

查看node1 和node2的IP情况
在node 上执行 ip a  发现node1的vip没有出现。
对node的 vip 进行处理
先停用然后启用网卡
nmcli device down eth4
nmcli device up eth4
发现ip启动成功,重启node2节点问题解决

3、问题:RAC启动后acfs磁盘没有自动挂载到本定,root使用命令 mount.acfs -o all 磁盘也没有挂载上

4、处理

1、查看acfs磁盘状态
grid用户 命令行登录 asmcmd 查看磁盘情况,没有识别到磁盘并且状态为disabled

 2、查看acfs进程是否启动,发现没有启动进行启动 root用户 /u01/grid/11.2/bin/acfsload start -s 

 3、再次查看磁盘状态为正常

 4、enable acfs磁盘 并挂载磁盘

   volenable -G PIC_DATA PIC

   mount.acf -o all

 4、gric常用命令

root执行
/u01/oracle_grid/bin/crsctl stop crs -f         #关闭集群
/u01/oracle_grid/bin/crsctl start crs           #启动集群
/u01/oracle_grid/bin/crsctl status res -t       #查看集群状态
/u01/oracle_grid/bin/crsctl check crs           #查看集群状态

grid用户
crs_stat -v -t                                            #查看集群状态
crsctl status res -t                                      #查看集群状态
srvctl start database -d lsrkzyk                          #启动数据库
srvctl stop database -d lsrkzyk                           #关闭数据库
crsctl status resource ora.lsrkzyk.db -f                  #查看某个进程状态
srvctl start instance -d lsrkzyk -i lsrkzyk1              #启动某个实例
crsctl 应该是cluster control 用的,它管理的是cluster level的内容,如crsd cssd css 等进程和配置的管理
srvctl 是资源的管理,是cluster内资源的管理,比如instance asm listener vip ons gsd  service .....

 

posted @ 2020-07-28 15:19  苍茫宇宙  阅读(1796)  评论(0编辑  收藏  举报