[Linux] shell中for循环grep正则统计指定关键字
需求是统计某个业务的访问个数日志服务器上的目录结构是如下,搜索最近7天的指定关键字数据,并排重统计个数:
drwxr-xr-x 2 root root 4096 Nov 15 08:00 2019-11-15 drwxr-xr-x 2 root root 4096 Nov 16 08:00 2019-11-16 drwxr-xr-x 2 root root 4096 Nov 17 08:00 2019-11-17 drwxr-xr-x 2 root root 4096 Nov 18 08:00 2019-11-18 drwxr-xr-x 2 root root 4096 Nov 19 08:00 2019-11-19 drwxr-xr-x 2 root root 4096 Nov 20 08:00 2019-11-20 drwxr-xr-x 2 root root 4096 Nov 21 08:00 2019-11-21 drwxr-xr-x 2 root root 4096 Nov 22 08:00 2019-11-22 [root@mail tmp]# ll /data1/mailLog/app/kafka/2019-11-22/ total 5708872 -rw-r--r-- 1 root root 4847545594 Nov 22 2019 api-mail-sina-com-cn.log
for循环的一行表示形式for ((i=15;i<=21;i++));do xxx;done
while循环的一行表示 while true;do xxx;done
获取当前年月`date +%Y-%m`
grep -oP只显示正则匹配到的内容
uniq|sort -u是去重
for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep -oP "appid=2026078627&uid=\d+"|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.log;done
把匹配到的日志去重放入了/tmp/2019-11-22.android.log
wc -l *.android.log 87851 2019-11-15.android.log 78686 2019-11-16.android.log 76190 2019-11-17.android.log 90938 2019-11-18.android.log 91705 2019-11-19.android.log 91388 2019-11-20.android.log 91796 2019-11-21.android.log
如果有不同的关键字,就多加几个grep,类似下面这个
for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep "2026078627"|grep "active_client"|grep -oP "device_id=[^&]+|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.device.log;done
十年开发经验程序员,离职全心创业中,历时三年开发出的产品《唯一客服系统》
一款基于Golang+Vue开发的在线客服系统,软件著作权编号:2021SR1462600。一套可私有化部署的网站在线客服系统,编译后的二进制文件可直接使用无需搭开发环境,下载zip解压即可,仅依赖MySQL数据库,是一个开箱即用的全渠道在线客服系统,致力于帮助广大开发者/公司快速部署整合私有化客服功能。
开源地址:唯一客服(开源学习版)
官网地址:唯一客服官网