linux 中根据指定列的重复或者唯一输出文本

 

001、 输出第一列中没有重复的文本

复制代码
[root@pc1 test02]# ls
a.txt
[root@pc1 test02]# cat a.txt     ## 测试数据
a       76
b       78
a       100
c       222
b       7777
b       3333
d       1111   ## 先把文本叠加一次, 然后引入文本行数变量; 如果重复多次,在叠加后的文本的后半部分,计数最少是3开始,依据此进行过滤
[root@pc1 test02]# cat a.txt a.txt | awk -v a=$(wc -l < a.txt) '++ay[$1] == 2 && NR > a'
c       222
d       1111
复制代码

 

002、输出指定列有重复的文本

复制代码
[root@pc1 test02]# ls
a.txt
[root@pc1 test02]# cat a.txt     ## 测试数据
a       76
b       78
a       100
c       222
b       7777
b       3333
d       1111       ## 先把文本叠加一次; 然后记录文本行数;  在叠加后的文本的后半部分,最低的计数是3,据此提取重复
[root@pc1 test02]# cat a.txt a.txt | awk -v a=$(wc -l < a.txt ) '++ay[$1] > 2 && NR > a'
a       76
b       78
a       100
b       7777
b       3333
复制代码

 。

 

posted @   小鲨鱼2018  阅读(43)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2021-10-23 R脚本中使用命令行 进行传参
2021-10-23 Bareword "mp4" not allowed while "strict subs" in use at (user-supplied code). ubuntu
2021-10-23 Package libxml-2.0 was not found in the pkg-config search path
2021-10-23 Package libcurl was not found in the pkg-config search path.
2021-10-23 linux系统中目录和普通文件无法使用颜色区分解决方法
2021-10-23 ll: command not found
2020-10-23 linux系统中du命令
点击右上角即可分享
微信分享提示