shell分析日志常用指令合集

  数据分析对于网站运营人员是个非常重要的技能,日志分析是其中的一个。日志分析可以用专门的工具进行分析,也可以用原生的shell脚本执行,下面就随ytkah看看shell分析日志常用指令有哪些吧。(log_file表示所在路径,完整的路径像这样:/www/var/***.log)

  1、查看当天有多少个IP访问:

1
awk '{print $1}' log_file|sort|uniq|wc -l

  2、查看某一个页面被访问的次数:

1
grep "/index.php" log_file | wc -l

  3、查看每一个IP访问了多少个页面:

1
awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file

  4、将每个IP访问的页面数进行从小到大排序:

1
awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n

  5、查看某一个IP访问了哪些页面:

1
grep ^111.111.111.111 log_file| awk '{print $1,$7}'

  6、去掉搜索引擎统计当天的页面:

1
awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l

  7、查看2018年11月21日14时这一个小时内有多少IP访问:

1
awk '{print $4,$1}' log_file | grep 21/Nov/2018:14 | awk '{print $2}'| sort | uniq | wc -l

  8、列出当天访问次数最多的IP

1
cut -d- -f 1 log_file |uniq -c | sort -rn | head -20

  原理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
       cut
 
       -d, --delimiter=DELIM
 
              use DELIM instead of TAB for field delimiter
 
              表示用-分割,然后-f 1
 
       -f, --fields=LIST
 
              select only these fields;  also print any line that contains  no
 
              delimiter character, unless the -s option is specified
 
           表示打印第一部分,就是ip
 
 uniq 是将重复行去掉, -c表示前面前面加上数目,
 
       sort -rn 就是按照数字从大到小排序,
 
       head -20取前面20行

  

  你可能会喜欢:shell日志分析进阶篇

posted @   ytkah  阅读(1340)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2017-12-07 【福利】公众平台全面开放原创功能
网址导航 gg N / G Sitemap

部分内容来源于网络,如有版权问题请联系删除

  
点击右上角即可分享
微信分享提示