Linux-awk和sort处理字符串

题目:

有一个文件b.txt

复制代码
1 http://www.baidu.com/index.html
2 http://www.google.com/index.html
3 http://www.baidu.com/get.html
4 http://www.baidu.com/set.html
5 http://www.google.com/index.html
6 http://www.yahoo.com.cn/put.html
7 http://www.yunpan.com/img
8 http://iot.com.cn/index
9 http://iot.com.cn/get
复制代码

要求将域名截取出来,并且统计出重复域名出现的次数:

1    2 iot.com.cn
2    3 www.baidu.com
3    2 www.google.com
4    1 www.yahoo.com.cn
5    1 www.yunpan.com 

代码如下:

awk -F '/' '{print $3}' b.txt | sort | uniq -c

讲解:

awk的基本用法

1
2
3
4
# 格式
$ awk 动作 文件名
# 示例
$ awk '{print $0}' demo.txt#-F 参数,指定分隔符,单引号中是指定的分割字段$ awk -F '/’

 $0 代表的是一整行的数据

sort和uniq结合使用:

uniq的参数-c ,表示在每列旁边显示该行重复的次数

 

参考文档:

http://www.ruanyifeng.com/blog/2018/11/awk.html

http://man.linuxde.net/awk

http://man.linuxde.net/sort

http://man.linuxde.net/uniq

 

posted @   豆芽花花儿酱  阅读(1077)  评论(0编辑  收藏  举报
编辑推荐:
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· 2 本地部署DeepSeek模型构建本地知识库+联网搜索详细步骤
历史上的今天:
2018-06-17 命令行运行postman脚本--基于数据驱动
点击右上角即可分享
微信分享提示