统计词频

地址:https://leetcode-cn.com/problems/word-frequency/

## 写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。
     示例:
     为了简单起见,你可以假设:
     
     words.txt只包括小写字母和 ' ' 。
     每个单词只由小写字母组成。
     单词间由一个或多个空格字符分隔。
     示例:
     
     假设 words.txt 内容如下:
     
     the day is sunny the the
     the sunny is is
     你的脚本应当输出(以词频降序排列):
     
     the 4
     is 3
     sunny 2
     day 1
     
 
`解题思路`

1 使用awk

    `awk '{for(i=1;i<=NF;i++){array[$i]++}}END{for (a in array){print a,array[a]}}' words.txt |sort -r -n -k2;
`
     
2 使用xargs uniq

        `cat words.txt|xargs -n 1|sort|uniq -c|sort -rn|awk '{print $2" "$1}' `
    

 

posted @ 2020-03-26 12:03  花花妹子。  阅读(86)  评论(0编辑  收藏  举报