摘要:
1、故障描述 今天下午,cell10存储节点莫名其妙地自动重启了。虽然数据库没有受到影响,但仍然需要弄清楚重启的原因。以下记录整个故障的分析过程。 2、故障分析 2.1 分析操作系统日志。故障前后的操作系统日志摘要如下所示。 Jan 4 09:25:29 dm01celadm10 auditd[12 阅读全文
摘要:
1、前言 Exadata存储节点,绝大部分情况下,是不需要主动更换磁盘的,当磁盘的损坏程度达到一定的判定标准,存储管理软件会自动将该磁盘判定为坏盘。 注意:该判定标准不仅仅依据于磁盘的坏块errorCount。 对于满足如下全部情况的环境,建议主动更换存储节点的磁盘: (1). 磁盘的errorCo 阅读全文
摘要:
1、案例概述 同事在AIX7.1下安装11.2.0.4 GI集群时,运行cluvfy命令失败。 报错信息如下: Version of exectask could not be retrieved from node "skdb1"ERROR:Remote execution files could 阅读全文
摘要:
1、案例概述 同事新搭建的一套GoldenGate环境,刚刚搭建时,Extract抽取进程就已经出现延迟现象,当时想着可能很快就能追平,所以最开始也没当回事。结果两天时间,延迟现象没有缓解,已经累积延迟30多个小时。通过info 或者 stats等命令查看进程状态信息, 发现该Extract抽取进程 阅读全文
摘要:
1. 故障概述 早晨8点左右,驻场同事打来电话,反馈Exadata上的ACFS文件系统全部消失,所有的OGG链路全部中断,业务影响范围非常大,几乎所有的核心业务都受到影响。让同事立即检查存储软件服务状态,发现所有存储节点的存储服务运行正常,但cell07和cell09节点各自损坏了一块硬盘。听到这个 阅读全文
摘要:
1. 故障描述 客户的Exadata X5-2, 某天收到EM13c告警,提示Exadata中的Infiniband交换机出现故障。 2. 故障处理 2.1 执行showunhealthy命令后,显示告警信息。 # showunhealthy WARNING Flash disk has bad b 阅读全文
摘要:
1、前言 注意:Oracle不建议客户使用手动方式进行补丁安装,客户应该使用opatch auto方式进行补丁安装工作。但是,在opatch auto的过程中如果出现问题,我们可以将本文档中的步骤作为临时解决方法。 2、故障描述 客户有一套Exadata环境下的11.2.0.4 RAC,近期进行安全 阅读全文
摘要:
为了测试YashanDB的RAC模式性能到底怎样,在测试环境进行了部署,简单记录一下。 0.环境说明计算节点一192.168.0.181(业务网)192.168.10.181(心跳网)计算节点二192.168.0.182(业务网)192.168.10.182(心跳网)共享存储:/dev/yas/c1 阅读全文
摘要:
1、故障概述 某Exadata客户,负责该项目的同事反馈:该Exadata的计算节点,几乎每半年左右就会出现内存不足的现象,需要重启一次操作系统才能缓解该故障。最后几天,系统剩余的内存只有4GB左右,监控系统经常告警。客户打算最近找个停机窗口进行重启操作。 2、故障分析 重启操作系统,虽然能释放内存 阅读全文
摘要:
1. 前言 为什么会有收缩根文件系统空间的这种需求呢,这主要是近期的一次Exadata升级项目遇到这种困境。一台11.2.3.3.0版本的Exadata,进行计算节点升级时,提示LVDbSys1的空间大于LVDbSys2的空间,无法进行操作系统备份,升级前的预检查工作失败。(LVDbSys1已经被扩 阅读全文