因为误操作, 节点1 chown -R oracle:oinstall /u01 这个目录下包含了grid 集群软件!!!
导致节点1重启crs报错,无法启动,查询mos 存在一个回退脚本! 但是回退失败,本次博客进行记录
1.仅回退oracle_home bin grid_home bin权限
如何在Grid Infrastructure环境上检查和修复文件权限(文档ID 1931142.1)
[root@wsgw1 /]# /u01/app/11.2.0/grid/crs/install/rootcrs.pl -init Using configuration parameter file: /u01/app/11.2.0/grid/crs/install/crsconfig_params
或者直接找好的节点权限手工同步,其他相同版本的也行;
2.Oracle_home or Grid_home整个目录权限都被误操作修改!!! 本次修复失败!
Script to capture and restore file permission in a directory (for eg. ORACLE_HOME) (Doc ID 1515018.1)
https://blog.csdn.net/lihuarongaini/article/details/99744774
在以前的案例中,多次出现由于误操作修改oracle rac相关目录权限,导致集群无法启动,以前官方给出来的解决方案,大部分情况是通过删除节点,增加解决的方式解决.在翻看最近的mos文档时发现Script to capture and restore file permission in a directory (for eg. ORACLE_HOME) (Doc ID 1515018.1),通过permission.pl来记录正常节点的权限,然后在异常节点执行(注意需要替换主机名).通过对该脚本简单测试,确认大概效果:
思路:1.找到好的节点或者相同版本集群软件配置进行权限同步脚本输出【实际上就是对整个目录及权限使用chown xx,chmod xx输出命令】
2.将权限修改脚本,进行编辑后,执行修改权限修改!完毕。
1.在正常节点上传脚本并且执行
[root@localhost tmp]
# chmod +x permission.pl
[root@localhost tmp]
# ./permission.pl /u01
2. 生成对应文件拷贝到故障节点修改并执行
./permission.pl /u01
Following log files are generated
logfile : permission-Tue-May-05-03-36-48-2021
Command file : restore-perm-Tue-May-05-03-36-48-2021.cmd
异常的节点1修改脚本,将RAC节点名称2=>1,ASM实例2=>1 然后执行.cmd脚本,执行成功!
[root@wsgw1 tmp]# cp restore-perm-Tue-May-05-03-36-48-2021.cmd restore_001.cmd
[root@wsgw1 tmp]# chmod +x restore_001.cmd
[root@wsgw1 tmp]# vi restore_001.cmd
:%s#wsgw2#wsgw1#g
:%s#+ASM2#+ASM1#g
:%s#+asm2#+asm1#g
[root@wsgw1 tmp]# ./restore_001.cmd
[root@wsgw1 tmp]# init 6