linux系统 comm命令

1、comm 用于对两个文件取交集或者并集,

   用法  comm file1 file2,生成三列数据,第一列file1唯一的行,第二列file2唯一的行,第三列file1和file2共有的行

   创建测试数据 a.txt b.txt

复制代码
cat a.txt
sss
eee
rrr
555
888
333
bbb
777
yyy

cat b.txt
yyy
ddd
sss
eee
666
kkk
mmm
jjj
复制代码

 

2、使用 comm命令前 需要对数据进行排序和去重复

    

复制代码
sort -u a.txt > a && mv a a.txt

cat a.txt
333
555
777
888
bbb
eee
rrr
sss
yyy

sort -u b.txt > a && mv a b.txt
666
ddd
eee
jjj
kkk
mmm
sss
yyy
复制代码

 

3、运行 comm a.txt b.txt

复制代码
comm a.txt b.txt
333
555
        666
777
888
bbb
        ddd
                eee
        jjj
        kkk
        mmm
rrr
                sss
                yyy
复制代码

生成三列数据,第一列a.txt唯一的行,第二列b.txt唯一的行,第三列a.txt和b.txt共有的行。

 

4、测试三个参数 -1、-2、-3

复制代码
comm a.txt b.txt -1
666
ddd
        eee
jjj
kkk
mmm
        sss
        yyy
###相当于删除了第一列

comm a.txt b.txt -2
333
555
777
888
bbb
        eee
rrr
        sss
        yyy
###相当于删除了第二列

comm a.txt b.txt -2 -1
eee
sss
yyy
###相当于删除了第一列和第二列

###其余以此类推
复制代码

 

5、取交集和并集 

 

复制代码
[root@linuxprobe test]# comm a.txt b.txt -2 -1
eee
sss
yyy
###取交集
[root@linuxprobe test]# comm a.txt b.txt | sed 's/^\t*//'
333
555
666
777
888
bbb
ddd
jjj
kkk
mmm
rrr
###取并集
 
复制代码

 

注意:使用comm命令前应当进行排序及去重复。

 

posted @   小鲨鱼2018  阅读(1067)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示