随笔分类 - 故障处理
摘要:数据库版本:19.10 RAC操作系统:redhat 7.6 最近收到数据库大量latch free告警,结合最近后台同步数据以及地市访问较为频繁,起初认为是正常现象,可后来告警实在是频繁,登录数据库分析了下大概情况 通过latch free:P2值查看具体的latch名称 --这里看到是real-
阅读全文
摘要:数据库版本:19.3 操作系统版本:redhat 7.6 周末下午六点多接到业务反馈,大量业务调用失败,请求排查数据库状态,登录数据库后发现数据库问题时间段出现大量的row cache lock事件 --问题点截图信息如下 通过上述事件,查看p1对应的信息是什么,通过v$event_name发现对应
阅读全文
摘要:操作系统:hp unix数据库版本:11.2.0.4背景:客户再asm磁盘组空间不足,添加磁盘组过程中因磁盘组属性问题导致加入磁盘组磁盘状态不对 处理排查过程1.查看磁盘组状态#这里可以看到磁盘组的mount_status:CLOSED,但是磁盘头信息已经是member,HEADER_STATUS:
阅读全文
摘要:事件背景描述:环境:Linux/Oracle12.2.0.1.0/RAC问题:数据库监听无法连接,集群异常问题处理过程:1.登录数据库查看相关状态,如下,发现crsd进程状态为cleaning 2.发现crsd进程异常后,判断可能是网络层面问题,通过查杀gipc进程集群并未恢复正常 3.联系主机工程
阅读全文
摘要:国产化推进过程中,项目上需要不断的对库进行拆分,我们使用的办法就是通过adg来进行拆分原有的数据库,说来也是比较奇怪,我们每次拆库都需要搭建八九套adg环境,但是每次出现adg坏块的都是应急4环境,这个问题也困扰了好久,或者也可以说是没有具体的深入分析过这个问题,这个问题最终还是拉着主机工程师发现的
阅读全文
摘要:解决此故障我也是第一次碰到,中间也是一头雾水,好在最终解决了问题 1.客户反馈数据库节点1宕机,切无法ping通主机,无法登录,登录主机后查看alert.log报错信息基本上断定网络突然出现问题,从系统层面主机发生重启 2.主机恢复后,启动crs集群,发现数据库没有正常open,手工open操作的时
阅读全文
摘要:最近项目在搞国产化,Oracle是支持非法日期的,相信可能很多人都不知道,如果非法日期是字符串形式的,那么比较好检查到,但是如果非法日期是date类型的,我们如何查询呢? 有人可能首先会想到直接查询结果(起初我就是这么查询的) 不好意思,这种方式无法查询出来,这里的nls_date已经修改为yyyy
阅读全文
摘要:同事说有一个问题比较奇怪,监听本来是1521端口,后来监听重启后,监听端口自动更改为1522,重建集群监听也没有用,仍然是1522,而且所有的配置文件都是正常的 登录服务器查看了下监听信息,确是是1522端口 这里我也查看了下监听配置文件、local_listener也是正常的,但是配置文件endp
阅读全文
摘要:今天某客户询问ORA-01406报错应该如何处理,查看信息如下,这里提示列被截断 这里提示的也很明显,使用一致的字符类型避免被截断 [oracle@rds ~]$ oerr ora 1406 01406, 00000, "fetched column value was truncated" //
阅读全文
摘要:手工回滚2pc事务如下报错 ORA-02075: another instance changed state of transaction 导致ORA-02075的原因是另一个实例中的会话发出了提交强制或回滚强制,并且它正在执行挂起事务的恢复。 故障处理 SQL> alter system dis
阅读全文
摘要:1.查看状态如下信息 2.两个关键命令 show database 'sbdb' statusreport; show database verbose SBDB; 3.查看状态信息 show database 'jkzy' statusreport; 根据报错检查数据库角色,查看之后什么都是正常的
阅读全文
摘要:今天碰见了两个常见小问题,简单记录下 1.Terminal too wide 处理方式:在当前会话界面输入以下内容stty columns 100 2.crontab无法调用 $ crontab -lcrontab:you are not authorized to use cron. Sorry.
阅读全文
摘要:contents of Memory Script: { backup as copy current controlfile for standby auxiliary format '/oradata/ORCL/control01.ctl'; restore clone primary cont
阅读全文
摘要:1.设置保留时间点 begin dbms_audit_mgmt.set_last_archive_timestamp( audit_trail_type => dbms_audit_mgmt.audit_trail_unified, last_archive_time => sysdate -1,
阅读全文
摘要:某客户反馈使用crt批量插入数据的中文字符是乱码,通过查看数据库字符集,建议客户在操作系统层面设置nls_lang环境变量,重新插入字符集正常无乱码 export NLS_LANG='SIMPLIFIED CHINESE_CHINA.ZHS16GBK'
阅读全文
摘要:验证oracle新特性,在线转换非分区为分区表的过程中,出现如下报错 SQL> alter table t modify 2 partition by range (object_id) interval (1000) 3 ( 4 partition p1 values less than (100
阅读全文
摘要:1.问题发生时间和处理过程 问题发生时间点: 2022年10月26日 12:00 ~ 2022年10月26日 12:30 问题故障处理过程: 2022年10月26日 12:00 ~ 2022年10月26日 12:30,业务侧反馈应用性能出现波动,登陆数据库查看数据库状态,发现数据库存在大量gc等待事
阅读全文
摘要:参考:log file sync等待事件处理思路_ITPUB博客 一:事务的过度提交 二:存储IO资源紧张,导致lgwr进程写速度缓慢 #典型的IO延迟问题,很容易分析 三:CPU资源紧张,lgwr进程获取不到相应的CPU时间片 #暂未碰到相似案例 四:RAC之间的scn同步 #暂未碰到相关类似案例
阅读全文
摘要:有时候我们的sysaux表空间增长很快,通过查询我们发现是SYS.WRI$_ADV_OBJECTS对应太大导致的,那么这个时候我们就需要清理该表 以下步骤均在生产环境实际执行过 SQL> COL SEGMENT_NAME FORMAT A30 SQL> COL OWNER FORMAT A10 SQ
阅读全文
摘要:在adg搭建过程中,备库启动到nomount状态,并且使用连接字符串测试可以连接上主备库,但是执行脚本就报错ora-01034 ora-27101 遇到这种报错,也是先百度了下,然后也没有遇到相关案例,这个报错就是提示服务备库没有启动,实际情况是备库已经启动到了nomount状态。 最终排查tnsn
阅读全文