linux系统 comm命令
1、comm 用于对两个文件取交集或者并集,
用法 comm file1 file2,生成三列数据,第一列file1唯一的行,第二列file2唯一的行,第三列file1和file2共有的行
创建测试数据 a.txt b.txt
cat a.txt
sss
eee
rrr
555
888
333
bbb
777
yyy
cat b.txt
yyy
ddd
sss
eee
666
kkk
mmm
jjj
2、使用 comm命令前 需要对数据进行排序和去重复
sort -u a.txt > a && mv a a.txt
cat a.txt
333
555
777
888
bbb
eee
rrr
sss
yyy
sort -u b.txt > a && mv a b.txt
666
ddd
eee
jjj
kkk
mmm
sss
yyy
3、运行 comm a.txt b.txt
comm a.txt b.txt
333
555
666
777
888
bbb
ddd
eee
jjj
kkk
mmm
rrr
sss
yyy
生成三列数据,第一列a.txt唯一的行,第二列b.txt唯一的行,第三列a.txt和b.txt共有的行。
4、测试三个参数 -1、-2、-3
comm a.txt b.txt -1
666
ddd
eee
jjj
kkk
mmm
sss
yyy
###相当于删除了第一列
comm a.txt b.txt -2
333
555
777
888
bbb
eee
rrr
sss
yyy
###相当于删除了第二列
comm a.txt b.txt -2 -1
eee
sss
yyy
###相当于删除了第一列和第二列
###其余以此类推
5、取交集和并集
[root@linuxprobe test]# comm a.txt b.txt -2 -1 eee sss yyy ###取交集
[root@linuxprobe test]# comm a.txt b.txt | sed 's/^\t*//'
333
555
666
777
888
bbb
ddd
jjj
kkk
mmm
rrr
###取并集
注意:使用comm命令前应当进行排序及去重复。