你所需要掌握的问题排查知识
摘要:1. 说之前 由于业务应用 bug(本身或引入第三方库)、环境原因、硬件问题等原因,线上服务出现故障 / 问题几乎不可避免。例如,常见的现象包括请求超时、用户明显感受到系统发生卡顿等等。 作为一个合格的研发人员(技术人员),不仅要能写得一手好代码,掌握如何排查问题技巧也是研发人进阶必须掌握的实战技能
阅读全文
posted @
2019-12-01 23:44
blogsheng
阅读(248)
推荐(0) 编辑
性能分析Linux服务器CPU利用率
摘要:CPU度量1. 指标范围1.1 User mode CPU utilization+ System mode CPU utilization合理值:60-85%,如果在一个多用户系统中us+sy时间超过85%,则进程可能要花时间在运行队列中等待,响应时间和业务吞吐量会受损害;us过大,说明有用户进程...
阅读全文
posted @
2016-01-21 14:54
blogsheng
阅读(51607)
推荐(4) 编辑
《构建高性能web站点》读书笔记:CPU/IO并发策略
摘要:服务器并发处理能力:单位时间内处理的请求数,吞吐率,reqs/sapache的mod_status,显示的 requests/sec,从启动开始的平均计算值。lighttpd的mod_status显示最近5S的吞吐率。并发用户数:多少个用户同时向服务器发送请求总请求数请求资源描述100个用户同时发送...
阅读全文
posted @
2016-01-21 14:52
blogsheng
阅读(1278)
推荐(0) 编辑
用iostat对linux硬盘IO性能进行检测
摘要:近期公司安装了几台DELL PE2650和2850的服务器,统一安装的是RHLE5.132位系统,而服务器的SCSI硬盘都统一做了raid1。公司老总要求对硬盘IO作统一检测报告,在Linux下找了许多工具,发现最实用的还是iostat,这个需要先安装sysstat ,即yum -y install...
阅读全文
posted @
2016-01-21 14:51
blogsheng
阅读(458)
推荐(0) 编辑
pgpgin|pgpgout|pswpin|pswpout意义与差异
摘要:引用来自:http://ssms.cs2c.com.cn/otrs/pc.pl?Action=PublicFAQZoom;ItemID=11741文章主要意思是:1. page in/out操作指把块设备中的页读入内存或把内存中的页写入块设备When ever program or data nee...
阅读全文
posted @
2015-12-30 22:49
blogsheng
阅读(1244)
推荐(0) 编辑
Linux I/O优化 磁盘读写参数设置
摘要:关于页面缓存的信息,可以用cat /proc/meminfo看到。其中的Cached 指用于pagecache的内存大小(diskcache-SwapCache)。随着写入缓存页,Dirty 的值会增加。一旦开始把缓存页写入硬盘,Writeback的值会增加直到写入结束。Linux 用pdflush...
阅读全文
posted @
2015-12-29 15:55
blogsheng
阅读(17522)
推荐(0) 编辑
[转]Linux内核源码详解--iostat
摘要:Linux内核源码详解——命令篇之iostat转自:http://www.cnblogs.com/york-hust/p/4846497.html本文主要分析了Linux的iostat命令的源码,iostat的主要功能见博客:性能测试进阶指南——基础篇之磁盘IOiostat源码共563行,应该算是L...
阅读全文
posted @
2015-11-27 17:06
blogsheng
阅读(739)
推荐(0) 编辑
sar监控工具详解
摘要:转自http://www.cnblogs.com/Amaranthus/p/3745680.htmlSARNAME: SAR报告,收集,保存系统活动信息语法:sar [ -A ] [ -b ] [ -B ] [ -C ] [ -d ] [ -h ] [ -i interval ] [ -m ] [-...
阅读全文
posted @
2015-11-27 17:02
blogsheng
阅读(1156)
推荐(0) 编辑
[转]oracle awr报告生成和分析
摘要:转自:http://blog.csdn.net/cuker919/article/details/8767328最近由于数据库cpu占用非常高,导致VCS常常自动切换,引起很多问题。最近学习一下数据库awr分析数据库sql执行性能的分析报告。下面将初步讲解一下:1、先登陆数据库,生成awr报告。li...
阅读全文
posted @
2015-11-16 09:44
blogsheng
阅读(2509)
推荐(0) 编辑
Oracle性能调整ASH,AWR,ADDM
摘要:ASH (Active Session History)ASH以V$SESSION为基础,每秒采样一次,记录活动会话等待的事件。不活动的会话不会采样,采样工作由新引入的后台进程MMNL来完成。ASH buffers 的最小值为1MB,最大值不超过30MB。内存中记录数据。期望值是记录一小时的内容。生...
阅读全文
posted @
2015-11-13 14:06
blogsheng
阅读(778)
推荐(0) 编辑
[转]lsof详解
摘要:lsof是一个功能强大的诊断工具,它可以通过进程与打开的文件进行联系,可以列出一个进程打开的所有文件信息.1 寻找与打开的文件相关联的进程通过指定文件,可以发现正在使用这个文件的进程# lsof /var/log/messagesCOMMAND PID USER FD TYPE DEVICE SIZ...
阅读全文
posted @
2015-11-07 23:26
blogsheng
阅读(565)
推荐(0) 编辑
iftop、ifstat详解
摘要:ifstat介绍ifstat工具是个网络接口监测工具,比较简单看网络流量实例默认使用#ifstat eth0 eth1 KB/s in KB/s out KB/s in KB/s out 0.07 0.20 0...
阅读全文
posted @
2015-11-07 23:17
blogsheng
阅读(1559)
推荐(0) 编辑
iotop详解
摘要:有时我们希望知道到底哪个进程产生了IO,这个时候就需要iotop这个工具了。它的输出和top命令类似,简单直观。官网:http://guichaz.free.fr/iotop/需要Python 2.5(及以上版本)和 Linux kernel 2.6.20(及以上版本),TASK_DELAY_ACC...
阅读全文
posted @
2015-11-07 23:00
blogsheng
阅读(12428)
推荐(0) 编辑
[转]NMON服务器监控、指标说明
摘要:一、NMON中的各项参数指标:SYS_SUMM:显示当前服务器的总体性能情况Total System I/OStatistics:Avg tps during an interval:显示采集间隔内磁盘平均I/O次数,该值等于Sheet DISK_SUMM中IO/sec列的平均值。Max tps d...
阅读全文
posted @
2015-09-24 10:49
blogsheng
阅读(727)
推荐(0) 编辑
Linux jstack分析cpu占用100%
摘要:背景:运行测试程序后,top命令发现某个进程(pid)占用cpu达到100%。查看哪个线程占用最多资源:ps mp pid -o THREAD,tid,命令查看这个进程下面的所有线程占用情况。发现线程324占用最多。使用jstack进行跟踪:jstack pid 进行查看输出到临时文件jstack ...
阅读全文
posted @
2015-09-02 15:37
blogsheng
阅读(1535)
推荐(0) 编辑
网站性能测试PV到TPS的转换以及TPS的波动和淘宝性能测试要点
摘要:《淘宝性能测试白皮书V0.3》 性能测试的难点不在于测,在于测出的数据和实际的对照关系,以及测试出来的数据对性能的评估(到底是好,还是不好)。 淘宝性能测试白皮书,解决了我的4个问题:1、PV到TPS的转换关系。2、TPS的波动标准。3、压力变化以及测试类型。4、网页测试的标准(可惜很多数据都抹掉了
阅读全文
posted @
2015-08-30 23:40
blogsheng
阅读(1200)
推荐(0) 编辑
理解Load Average做好压力测试
摘要:http://dongyajun.iteye.com/blog/645553http://www.blogjava.net/cenwenchu/archive/2008/06/30/211712.html
阅读全文
posted @
2015-08-30 23:21
blogsheng
阅读(239)
推荐(0) 编辑
GC浅析之三-性能调优经验总结
摘要:性能调优经验总结问题的出现:在日常环境下,以某server为例,该机器的每秒的访问量均值在368左右,最大访问量在913。对外提供服务的表现为每两三个小时就有秒级别的时间客户端请求超时,在访问量增大的情况下用户请求超时频率明显增多。现象的直接分析:通过监控GC发现该现象,GC中比较频繁的出现prom...
阅读全文
posted @
2015-08-30 22:48
blogsheng
阅读(890)
推荐(0) 编辑
性能测试指标的理解--cpu和load
摘要:第一次做性能测试,按照操作文档磕磕碰碰的完成了,并且拿到了结果,看到一堆的指标和数据,还是傻眼了,不知道各个指标是什么意思了。咨询了大牛和度娘,消化理解了一下,不知道是不是正确的。CPU使用率:一段时间内CPU的使用状况,从这个指标可以看出某一段时间内CPU资源被占用的情况。Load Average...
阅读全文
posted @
2015-08-30 22:44
blogsheng
阅读(1738)
推荐(1) 编辑
Linux下的CPU性能瓶颈分析案例
摘要:问题描述:在对notify执行性能测试时发现cpu负载突然飙高,cpu利用率高达95%。这时候就要排查是哪些线程消耗了cpu,并从代码层找到占用cpu的“罪魁祸首”。步骤:1.先用ps+grep找到被测试的进程pid。比如:ps–ef|grep notify,得到pid为29128。2.执行top ...
阅读全文
posted @
2015-08-30 22:43
blogsheng
阅读(1621)
推荐(0) 编辑