uniq和sort的一次亲密接触

           我学习linux也有段时间了,从字面意思理解uniq就是删除重复行,而sort当然是职业排序。直到某个漆黑的夜晚的那次亲密接触… …

           那时我在做道百度面试题:

处理以下文件内容,将域名取出并进行计数排序,如处理: 
http://www.baidu.com/index.html
http://www.baidu.com/1.html
http://post.baidu.com/index.html
http://mp3.baidu.com/index.html
http://www.baidu.com/3.html
http://post.baidu.com/2.html
得到如下结果: 
域名的出现的次数 域名
3 www.baidu.com
2 post.baidu.com 
1 mp3.baidu.com 
可以使用bash/perl/php/c任意一种

       当时想,排序用sort,统计用wc。可wc不能把相同条目合并,一下就犯难了。后来想想uniq和sort的搭配,man了下uniq,有个c选项,哈哈,试试。。。

   1: [root@apache bash]# awk -F / '{print $3}' file.txt|sort -r |uniq -c
   2:       3 www.baidu.com
   3:       2 post.baidu.com
   4:       1 mp3.baidu.com

posted on 2010-06-22 22:33  小致  阅读(205)  评论(0编辑  收藏  举报

导航