grid问题处理流程方式
1、grid进程启动流程
2、各个进程解析
1.cssdagent
以root用户权限启动,负责启动cssd进程。
2.orarootagent
以root用户权限启动,负责启动以下这些守护进程:crsd进程、ctssd进程、Diskmon进程、acfs进程。这些进程也都是以root用户权限启动。
3.oraagent
以grid用户权限启动,负责mdnsd进程、gipcd进程、gpnpd进程、evmd进程、asm进程(11gR2之后的asm在集群中被放置到了更底层,和之前版本区别较大)。
4.cssdmonitor。
以root用户权限启动,负责cssdmonitor进程的启动。
3、通过ps -ef|grep cssdagent 命令进行查看,在哪个进程失败,查看对应的日志
4、grid日志路径
$ORACLE_HOME/log/
├── crs
├── diag
│ ├── adrci_dir.mif
│ ├── clients
│ │ └── user_root
│ │ └── host_1874443374_80
│ │ ├── alert
│ │ │ └── log.xml
│ │ ├── cdump
│ │ ├── incident
│ │ ├── incpkg
│ │ ├── lck
│ │ │ ├── AM_1096102193_3488045378.lck
│ │ │ ├── AM_1096102262_3454819329.lck
│ │ │ ├── AM_1744845641_3861997533.lck
│ │ │ └── AM_3216668543_3129272988.lck
│ │ ├── metadata
│ │ │ ├── ADR_CONTROL.ams
│ │ │ ├── ADR_INVALIDATION.ams
│ │ │ ├── INC_METER_IMPT_DEF.ams
│ │ │ └── INC_METER_PK_IMPTS.ams
│ │ ├── metadata_dgif
│ │ ├── metadata_pv
│ │ ├── stage
│ │ ├── sweep
│ │ └── trace
│ │ ├── ora_8614_140501792864000.trc
│ │ ├── ora_8614_140501792864000.trm
│ │ ├── ora_8656_140272030783232.trc
│ │ ├── ora_8656_140272030783232.trm
│ │ ├── ora_8761_139627662771968.trc
│ │ ├── ora_8761_139627662771968.trm
│ │ ├── ora_9690_140391413298944.trc
│ │ ├── ora_9690_140391413298944.trm
│ │ └── sqlnet.log
│ └── tnslsnr
│ └── rac1
│ └── listener_scan1
│ ├── alert
│ │ └── log.xml
│ ├── cdump
│ ├── incident
│ ├── incpkg
│ ├── lck
│ │ ├── AM_1096102193_3488045378.lck
│ │ ├── AM_1096102262_3454819329.lck
│ │ ├── AM_1744845641_3861997533.lck
│ │ └── AM_3216668543_3129272988.lck
│ ├── metadata
│ │ ├── ADR_CONTROL.ams
│ │ ├── ADR_INVALIDATION.ams
│ │ ├── INC_METER_IMPT_DEF.ams
│ │ └── INC_METER_PK_IMPTS.ams
│ ├── metadata_dgif
│ ├── metadata_pv
│ ├── stage
│ ├── sweep
│ └── trace
│ └── listener_scan1.log
└── rac1
├── acfs
│ └── kernel
│ ├── acfs.log.0
│ └── file.order
├── acfslog
├── acfsrepl
├── acfsreplroot
├── acfssec
├── admin
├── agent
│ ├── crsd
│ │ ├── oraagent_grid
│ │ │ ├── oraagent_grid.log
│ │ │ ├── oraagent_gridOUT.log
│ │ │ └── oraagent_grid.pid
│ │ ├── oraagent_oracle
│ │ │ ├── oraagent_oracle.log
│ │ │ ├── oraagent_oracleOUT.log
│ │ │ └── oraagent_oracle.pid
│ │ ├── orarootagent_root
│ │ │ ├── orarootagent_root.l01
│ │ │ ├── orarootagent_root.log
│ │ │ ├── orarootagent_rootOUT.log
│ │ │ └── orarootagent_root.pid
│ │ └── scriptagent_grid
│ │ ├── scriptagent_grid.log
│ │ └── scriptagent_gridOUT.log
│ └── ohasd
│ ├── oraagent_grid
│ │ ├── oraagent_grid.log
│ │ ├── oraagent_gridOUT.log
│ │ └── oraagent_grid.pid
│ ├── oracssdagent_root
│ │ └── oracssdagent_root.log
│ ├── oracssdmonitor_root
│ │ └── oracssdmonitor_root.log
│ └── orarootagent_root
│ ├── orarootagent_root.log
│ ├── orarootagent_rootOUT.log
│ └── orarootagent_root.pid
├── alertrac1.log
├── client
│ ├── clsc_1.log
│ ├── clsc1.log
│ ├── clsc_2.log
│ ├── clsc2.log
│ ├── clsc3.log
│ ├── clsc4.log
│ ├── clsc5.log
│ ├── clsc6.log
│ ├── clsc7.log
│ ├── clsc8.log
│ ├── clscfg1.log
│ ├── clscfg.log
│ ├── clsc.log
│ ├── crsctl_grid.log
│ ├── crsctl_root.log
│ ├── crswrapexece.log
│ ├── css1.log
│ ├── css.log
│ ├── gpnptool_13368.log
│ ├── gpnptool_13374.log
│ ├── gpnptool_9192.log
│ ├── gpnptool_9197.log
│ ├── ocr_10572_7.log
│ ├── ocr_7844_3.log
│ ├── ocr_7849_3.log
│ ├── ocrcheck_14518.log
│ ├── ocrcheck_8614.log
│ ├── ocrconfig_11384.log
│ ├── ocrconfig_12870.log
│ ├── ocrconfig_8656.log
│ ├── oifcfg.log
│ └── olsnodes.log
├── crflogd
│ ├── crflogd.log
│ └── crflogdOUT.log
├── crfmond
│ ├── crfmond.l01
│ ├── crfmond.log
│ └── crfmondOUT.log
├── crsd
│ ├── crsd.log
│ └── crsdOUT.log
├── cssd
│ ├── cssdOUT.log
│ └── ocssd.log
├── ctssd
│ ├── ctssdOUT.log
│ └── octssd.log
├── cvu
│ ├── cvulog
│ │ └── cvu20161026221912.log
│ └── cvutrc
│ ├── cvuhelper.log.0
│ └── cvutrace.log.0
├── diskmon
├── evmd
│ ├── evmd.log
│ └── evmdOUT.log
├── gipcd
│ ├── gipcd.l01
│ ├── gipcd.l02
│ ├── gipcd.l03
│ ├── gipcd.log
│ └── gipcdOUT.log
├── gnsd
├── gpnpd
│ ├── gpnpd.log
│ ├── gpnpdOUT.log
│ └── rac1.pid
├── mdnsd
│ ├── mdnsd.log
│ └── mdnsdOUT.log
├── ohasd
│ ├── ohasd.log
│ └── ohasdOUT.log
├── racg
│ ├── racgeut
│ ├── racgevtf
│ └── racgmain
└── srvm
5、诊断文件收集
如果通过本文没有找到问题原因,请使用 root 用户,在所有的节点上执行 $GRID_HOME/bin/diagcollection.sh ,并上传在当前目录下生成所有的 .gz 压缩文件来做进一步诊断。