根据日志查看QPS

背景:线上有一个推荐服务,日志量比较大,想确认下是不是qps过高

问题:如何根据日志查看一个服务的qps

tail -f XXX.log,可以发现日志格式如下:

[8708-10 14:51:44 638 INFO ] [async task worker[61]] recommend.components.KeywordService[87] - cateid=252 pageNum=1 
[8708-10 14:51:44 666 INFO ] [async task worker[62]] recommend.components.KeywordService[87] - cateid=42205 
[8708-10 14:51:44 673 INFO ] [async task worker[0]] recommend.components.KeywordService[87] - cateid=29 pageNum=2 
[8708-10 14:51:44 677 INFO ] [async task worker[1]] recommend.components.KeywordService[87] - cateid=252 pageNum=3 

日志规范中,有一列“请求时间”,可以通过这个“请求时间”估算出服务的qps, 步骤如下:
(1)先找一条使得一个请求有且只有一行的日志,常用工具是grep,此例需要grep recommend.components.KeywordService,得出的结果,一个请求对应一行日志
(2)取出时间这一列,常用的工具是cut或者awk,这里介绍一下cut(大家到linux上去man一下)
    -d 参数,按照某个字符分隔
    -f 参数,取出分隔后的第几列
    这个例子中,按照“空格”分隔后,时间在第二列
进行1,2两步操作后,得到的结果为

   14:51:44
    14:51:44
    14:51:45
    14:51:45
    14:51:46
    14:51:46

(3)对结果进行去重,取计数,常用的工具是uniq,参数是-c

故,整个shell命令是:
命令:tail -f XXX.log | grep recommend.components.KeywordService | cut -d' ' -f2 | cut -d':' -f3 | uniq -c
说明:取增量 | 一个请求取一行 | 把时间截取出来 | 把秒数截取出来 | 去重取计数
得到的结果是

    136 43
    126 44
    115 45
    131 46
    132 47

可以看到,14:51:43,共有136条日志
    44,有126条日志
    45,有115条日志
    ...

结论,这个模块,单机的qps在120-130左右

posted @ 2019-03-11 13:55  _raindrop  阅读(264)  评论(0编辑  收藏  举报