摘要:
事件背景:由于省库压力较大,业务连接弱读节点时,偶尔忘记加弱读参数后仍会路由到主,导致生产故障,对省库搭建备库后,经分抽数类业务迁移到备库 搭建完毕备库后,经分业务根据提供的连接串无法抽取文件,业务报错如下,通过如下报错信息搜索了下官网,给出修改sessionVariables = net_writ 阅读全文
摘要:
移动现场有一个原厂写的通过gv$plan_cache_plan_stat视图来查询执行计划突变的SQL,通过比较gv$plan_cache_plan_stat视图记录的不同执行计划来判断是否执行计划发生突变而导致的执行计划变差,但是在gv$plan_cache_plan_stat视图中只有一个执行计 阅读全文
摘要:
文档编写这块确是不太好,但出现故障后又想记录点什么,仅仅记录下信息,并分享下问题的处理思路 上午十一点半左右收到告警信息,500租户使用率异常,告警信息如下 "【云境平台告警通知】: 资源类型:OceanBase集群; 资源名称:xxxx; 发生时间:2024-06-21 11:36:14; 告警内 阅读全文
摘要:
说明:oba脚本通过变量的方式直接实现以下三个查询,如手工查询需要分别执行SQL获取对应的变量信息 1.server_id检查方式select a.id server_id,a.svr_ip,a.zone,b.primary_zone,b.tenant_name from __all_server 阅读全文
摘要:
之前在培训的时候,OceanBase的老师就说过,当主机CPU使用率超过85%之后,SQL的就会急剧下降。但是具体性能回退多少,并为详细说明,最近分析问题的时候刚好碰到相关案例,简单记录下 ocp记录的主机CPU相关信息如下 6-1号下午6:30左右,通过ocp主机性能分析模块发现主机CPU突然飙升 阅读全文
摘要:
今天下午三点左右收到业务告警,批量业务发生断链 "数据库连接异常,次数:35,统计周期:5 分钟" 业务反馈具体的地市出现问题后,通过ocp发现问题时间段的SQL相应时间最多的是update相关操作 通过ocp中的SQL诊断功能发现问题时间点的可疑SQL排序第一的SQL为一个update 通过gv$ 阅读全文
摘要:
下午同事询问3.x版本是否支持指定租户的合并操作,印象中没有,在官网上查询了下,也没有相关的操作手册,官方手册3.x地址如下: https://www.oceanbase.com/docs/enterprise-oceanbase-database-cn-0000000001417800 正好手头上 阅读全文
摘要:
日常运维过程中,我们经常会使用OceanBase的trace_id来定位问题,trace_id是唯一表示SQL执行语句的,如果我们知道trace_id如何转换为地址,我们就知道了该SQL在哪个节点上执行的。 下面来演示如何通过trace_id来获取地址信息以及端口 lixingdeMacBook-P 阅读全文
摘要:
数据库版本:19.10 RAC操作系统:redhat 7.6 最近收到数据库大量latch free告警,结合最近后台同步数据以及地市访问较为频繁,起初认为是正常现象,可后来告警实在是频繁,登录数据库分析了下大概情况 通过latch free:P2值查看具体的latch名称 --这里看到是real- 阅读全文
摘要:
群里看到有一个大哥需求计算当天的binlog大小,有一个大哥给出下面的shell脚本 ls --full-time|grep ^-|awk '{s[$6]+=$5} END{for(i in s){printf("%s %0.2f\n",i,s[i]/1024/1024)}}' 这里做下解释。并记录 阅读全文