shell编程题(十八)
题目:
统计IP访问:要求分析apache访问日志,找出访问页面数量在前100位的IP数。日志大小在78M左右。
以下是apache的访问日志节选
202.101.129.218 - - [26/Mar/2006:23:59:55 +0800] "GET /online/stat_inst.php?pid=d065 HTTP/1.1" 302 20-"-" "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
答案:
#!/bin/bash awk '{print $1}' $1 | sort | uniq -c | sort -k1nr | head -n3
解析:
awk '{print $1}' $1
将文件中每一行按照空格隔开成许多域,选中第一个域
sort
默认按照ASCII码排序
uniq -c
在每一列旁边显示该行重复的次数
sort -k1nr
-k 指定类型或关键字排序
-k1 在本题中就是指定第一列的次数排序
-n 按数值排序
-r 逆序,默认是增序,逆序就是指降序
head -n3
head 用来显示档案的开头至标准输出中,默认 head 命令打印其相应文件的开头 10 行
-n<行数> 显示的行数(行数为负数表示从最后向前数)
sort 和 uniq详细点介绍 https://www.cnblogs.com/wanghao-boke/p/12122042.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)