sort 是 Linux 的排序命令,而且可以依据不同的数据类型来进行排序。sort 将文件的每一行作为一个单位,相互比较。比较原则是从首字符向后,依次按 ASCII 码值进行比较,最后将它们按升序输出。
sort 命令格式如下:
sort 命令格式如下:
[root@localhost ~]# sort [选项] 文件名
选项:- -f:忽略大小写;
- -b:忽略每行前面的空白部分;
- -n:以数值型进行排序,默认使用字符串排序;
- -r:反向排序;
- -u:删除重复行。就是 uniq 命令;
- -t:指定分隔符,默认分隔符是制表符;
- -k [n,m]:按照指定的字段范围排序。从第 n 个字段开始,到第 m 个字(默认到行尾);
sort 命令默认是用每行开头的第一个字符来进行排序的,比如:
[root@localhost ~]# sort /etc/passwd #排序用户信息文件 abrt:x:173:173::/etc/abrt:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin apache:x:48:48:Apache:/var/www:/sbin/nologin bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin …省略部分输出…
如果想要反向排序(倒序),则使用“-r”选项,比如:
[root@localhost ~]# sort -r /etc/passwd #反向排序 vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin tcpdump:x:72:72::/:/sbin/nologin …省略部分输出…
如果想要指定排序的字段,则需要使用"-t"选项指定分隔符,并使用"-k"选项指定字段号。
假如我想要按照 UID 字段排序 /etc/passwd 文件,命令如下:
[root@localhost ~]# sort -t":"-k 3,3 /etc/passwd #指定分隔符是":",以第三个字段开头,以第三个字段结尾排序,也就是只用第三个字段排序 root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin …省略部分输出…
看起来好像很美,可是如果仔细看看,怎么 daemon 用户的 UID 是 2,反而排在了下面?这是因为 sort 默认是按照字符排序的,前面用户的 UID 的第一个字符都是 1,所以这么排序。要想按照数字排序,请使用"-n"选项,比如:
[root@localhost ~]# sort -n -t":" -k 3,3 /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spod/lpd:/sbin/nologin ...省略部分输出...
-k 3.1,3.1 以第3列的第一个字符到第3列的第一个字符排序【0,1,2】
-k 4.1,4.3 以第4列的第一个字符到第4列的第3个字符排序【151,152,153,1,2,20】
排序后去重
使用-u参数去重
[root@test1 tmp]# cat 2.log 序号 企业名称 公网IP地址 1 国海证券 113.16.174.228 3 兴业证券 61.154.12.206 2 平安证券 211.157.16.114 3 兴业证券 61.154.12.206 [root@test1 tmp]# cat 2.log |sort -u 1 国海证券 113.16.174.228 2 平安证券 211.157.16.114 3 兴业证券 61.154.12.206 序号 企业名称 公网IP地址
按照文件大小进行排序
使用-h参数,按照人类习惯阅读方式比较文件大小
将两个文件合同同时对合并后的内容排序
[root@test1 tmp]# sort 2.log 5.log > 6.log [root@test1 tmp]# cat 6.log 1 test 1 1 国海证券 113.16.174.228 2 test2 2 2 平安证券 211.157.16.114 3 兴业证券 61.154.12.206 3 兴业证券 61.154.12.206 序号 企业名称 公网IP地址
排序并去重,并统计出现的次数
本文来自博客园,作者:孙龙-程序员,转载请注明原文链接:https://www.cnblogs.com/sunlong88/p/16356693.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· DeepSeek在M芯片Mac上本地化部署
· 葡萄城 AI 搜索升级:DeepSeek 加持,客户体验更智能
2021-06-08 golang中string int float bool类型相互转换
2019-06-08 golang数据运算符