【文件去重】linux下的几种文本去重方法
1、传统方法:cat xx | sort | uniq
优点:简单直接
缺点:顺序乱了
2、awk命令去重输出:awk '!x[$0]++' filename
应用扩展1:cat Afile Bfile|awk '!x[$0]++' >Cfile
依次输出A、B两个文件内容,去掉B中与A重复的行,输出到C;多应用于日志拼接。
灵活扩展2:cat Afile|awk '!x[$0]++'
也可以写作:awk '!x[$0]++' Afile
去掉重复的行,输出A文件
3、vim通配符:
: sort //可以直接排序,这个太好用了
:g/^.∗.∗$\n\1$/d //去除重复行
:g/\%(^\1$\n\)\@<=.∗.∗$/d //功能同上,也是去除重复行
:g/\%(^\1\>.*$\n\)\@<=\k\+\k\+.*$/d//功能同上,也是去除重复行
这几条命令我抄的,没用成功,有用成功了的麻烦告诉下,谢谢。
————————————————
版权声明:本文为CSDN博主「川中胡子」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_40809549/article/details/82591302
分类:
Linux命令
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具