随笔分类 -  Troubleshooting

Java应用性能瓶颈分析思路
摘要:1 问题描述 因产品架构的复杂性,可能会导致性能问题的因素有很多。根据部署架构,大致的可以分为应用端瓶颈、数据库端瓶颈、环境瓶颈三大类。可以根据瓶颈的不同部位,选择相应的跟踪工具进行跟踪分析。 应用层面瓶颈大致有如下两类,一是应用服务端复杂的逻辑处理导致应用端代码执行慢;二是资源锁争用导致线程阻塞问 阅读全文

posted @ 2023-08-30 16:59 王.小辉 阅读(387) 评论(0) 推荐(0) 编辑

Windows环境下文件偶发删除跟踪方法
摘要:根据微软工程师建议,采用开启文件Audit监控方式跟踪。 一、开启文件Audit 1.找到dll文件存放的文件夹。 2.右键单击此文件夹,然后选择“属性”。 3.转到“安全”选项卡,然后单击“高级”。 4.转到“审计”选项卡,然后单击“继续”。 5.单击“添加”,然后选择要监视的用户或组。 6.在“ 阅读全文

posted @ 2023-04-19 10:59 王.小辉 阅读(147) 评论(0) 推荐(0) 编辑

Process Monitor操作步骤
摘要:Process Monitor日志:Step 1: 创建目录"C:\mstrace"Step 2: 下载Process Monitor ,链接 http://technet.microsoft.com/en-us/sysinternals/bb896645 并且解压缩到"C:\mstraceStep 阅读全文

posted @ 2022-07-11 14:50 王.小辉 阅读(650) 评论(0) 推荐(0) 编辑

Nginx log_format性能参数$request_time $upstream_response_time
摘要:log_format是指存储日志的时候所采用的格式,可以在/usr/local/nginx/conf/nginx.conf的http字段中设置 默认配置如下: log_format main '$remote_addr - $remote_user [$time_local] "$request" 阅读全文

posted @ 2022-03-04 19:25 王.小辉 阅读(451) 评论(0) 推荐(0) 编辑

【Real World Case】异常捕获失败导致事务未提交问题
摘要:1、问题现象 从用户层面看,问题时段多个功能出现功能卡住、”Lock wait timeout exceeded; try restarting transaction”等事务等待超时报错。 从数据库层面看,跟踪数据库会话,发现存在较多阻塞,阻塞源会话ID固定,阻塞源会话为非活动状态,会话相关SQL 阅读全文

posted @ 2022-01-14 15:56 王.小辉 阅读(281) 评论(0) 推荐(0) 编辑

【Real World Case】12.2.0.1版本OracleClient bug导致线程阻塞
摘要:最近有生产环境突发系统整体卡死的问题,问题出现后只能通过重启iis解决,检查问题时段应用和数据库服务器系统资源占用正常、数据库会话正常未出现阻塞及明显等待。抓取w3wp.exe进程dump,发现存在大量线程阻塞,阻塞源线程非产品引入、被锁的对象位于ODP层面。 根据Debugdiag分析,有132个 阅读全文

posted @ 2022-01-06 09:35 王.小辉 阅读(123) 评论(0) 推荐(0) 编辑

借助Windows Error Reporting Service 服务抓取iis crash dump
摘要:三步配置自动抓取w3wp.exe进程crash dump。 (1)启动Windows Error Reporting Service服务 (2)将如下脚本保存到文本中,命名为iis-crash-dump并保存为reg格式 Windows Registry Editor Version 5.00 [H 阅读全文

posted @ 2021-06-03 09:12 王.小辉 阅读(810) 评论(0) 推荐(0) 编辑

Java应用内存泄漏/内存占用高问题分析
摘要:问题描述 内存泄漏(Memory leak)是在计算机科学中,由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失,而是应用程序分配某段内存后,由于设计错误,导致在释放该段内存之前就失去了对该段内存的控制,从而造成了内存的浪费。 GSCloud产品中,真正的内存泄漏比较 阅读全文

posted @ 2021-04-11 15:53 王.小辉 阅读(849) 评论(0) 推荐(0) 编辑

Java内存溢出(Out Of Memory,简称OOM)Troubleshooting
摘要:1 问题描述 内存溢出(Out Of Memory,简称OOM)是指应用系统中存在无法回收的内存或使用的内存过多,最终使得程序运行要用到的内存大于能提供的最大内存。此时程序就运行不了,系统会提示内存溢出,有时候会自动关闭软件,重启电脑或者软件后释放掉一部分内存又可以正常运行该软件,而由系统配置、数据 阅读全文

posted @ 2021-04-11 15:35 王.小辉 阅读(1685) 评论(0) 推荐(0) 编辑

Java CPU High Troubleshooting
摘要:问题描述 性能测试环境不定期出现系统整体响应卡顿,在问题时段CPU及内存资源占用率较高,高峰时段CPU占用率超过90%。 故障排查 通过top -H命令查看 top CPU 线程,并通过printf "%x\n" PID命令,将PID转换为nid值。 查看top CPU线程信息,并确认现场信息,发现 阅读全文

posted @ 2021-04-11 15:28 王.小辉 阅读(123) 评论(0) 推荐(0) 编辑

JProfiler使用说明及常用案例分析
摘要:1 配置远程连接 (1)启动JProfiler,选择Attach to a running JVM (2)选择Quick Attach,然后选择On another computer,然后选择Edit,选择直接SSH连接并填写远程环境信息。填完远程信息后选择start开始跟踪。 (3)远程机器连接成 阅读全文

posted @ 2021-04-11 15:22 王.小辉 阅读(2739) 评论(0) 推荐(0) 编辑

MAT(Eclipse Memory Analyzer)使用说及注意事项
摘要:1 下载地址 Eclipse Memory Analyzer Open Source Project | The Eclipse Foundation https://www.eclipse.org/mat/ 2 通过配置设置文件MemoryAnalyzer.ini的-Xmx参数修改工具内存分配。因 阅读全文

posted @ 2021-04-11 15:14 王.小辉 阅读(877) 评论(0) 推荐(0) 编辑

Java Troubleshooting
摘要: 阅读全文

posted @ 2021-04-10 23:59 王.小辉 阅读(95) 评论(0) 推荐(0) 编辑

Java应用性能瓶颈分析思路
摘要:1 问题描述 因产品架构的复杂性,可能会导致性能问题的因素有很多。根据部署架构,大致的可以分为应用端瓶颈、数据库端瓶颈、环境瓶颈三大类。可以根据瓶颈的不同部位,选择相应的跟踪工具进行跟踪分析。 应用层面瓶颈大致有如下两类,一是应用服务端复杂的逻辑处理导致应用端代码执行慢;二是资源锁争用导致线程阻塞问 阅读全文

posted @ 2021-04-03 11:02 王.小辉 阅读(1340) 评论(0) 推荐(1) 编辑

DB性能瓶颈分析思路
摘要:在性能分析过程中,经常遇到性能瓶颈出现在SQL的情况,此类问题通常可以分为两大类场景,一是SQL自身性能差导致的慢,如索引缺失、索引失效、统计信息不准确、SQL过于复杂等;二是由于外部原因等待导致的SQL执行慢,如某些系统资源导致的等待、数据资源争用导致的会话阻塞等。 对于SQL慢的情况,通常可以采 阅读全文

posted @ 2021-04-03 10:44 王.小辉 阅读(452) 评论(0) 推荐(0) 编辑

Effective SQL
摘要:在准备针对开发角色SQL优化的PPT时将需要着重注意的几个点梳理如下,持续更新... 阅读全文

posted @ 2021-01-22 11:19 王.小辉 阅读(70) 评论(0) 推荐(0) 编辑

Java Native Memory Tracking(NMT)
摘要:典型特性 (1)NMT功能默认关闭 (2)借助jcmd工具可以获取摘要/详细报告 (3)建立基线并比较其变换量 (4)在进程退出时打印内存报告 1.开启方法 启动目录中添加如下参数,默认为off,可以设置为summary或detail来打印概要或详细信息。 -XX:NativeMemoryTrack 阅读全文

posted @ 2021-01-22 10:52 王.小辉 阅读(696) 评论(0) 推荐(0) 编辑

OracleClient11.2.0.1版本bug导致异常问题汇总
摘要:生产项目中,Oracle客户端11.2.0.1版本作为当前应用最广泛的客户端版本,在使用过程多次发现因其bug导致的各种严重稳定性问题,特此收集相关案例以备查阅。当前发现的问题主要包括CPU占用高、出现ora-03113报错、进程crash三类。 分析案例:应用服务器W3WP进程CPU持续超过百分之 阅读全文

posted @ 2021-01-08 15:35 王.小辉 阅读(720) 评论(0) 推荐(0) 编辑

【Real World Case】Oracle客户端bug导致“尝试读取或写入受保护的内存。这通常指示其他内存已损坏。”
摘要:近期有生产项目反馈频繁出现iis crash,但是Windows日志未记录crash相关的详细信息。因此借助procdump工具抓取crash时刻dump,再进行分析。 (1)procdump抓取crash dump D:\Tools\Procdump>procdump -ma -n 3 -e w3 阅读全文

posted @ 2021-01-07 17:31 王.小辉 阅读(436) 评论(0) 推荐(0) 编辑

【Real World Case】记一次显示GC导致的“服务器太忙”报错
摘要:有生产项目反馈iis web应用在使用过程出现“服务器太忙”报错,检查思路简单记录之 检查思路: (1)问题时段任务管理器查看w3wp.exe进程CPU占用50%左右,内存1.5G左右,线程数350且持续增长。 (2)抓w3wp.exe进程dump,分析发现显式调用GC,导致大量线程处于活动状态。因 阅读全文

posted @ 2021-01-06 18:31 王.小辉 阅读(204) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示