Linux 下统计某个文件的词频

Linux 下统计某个文件的词频

摘抄自Letcode

文本内容

QGKU6x.png

脚本

# xarhs -n 1 每个单词逐行显示
# uniq -c 去重并且输入记录次数
# sort -n 排序  -r相反的顺序进行排序
# 分析文本内容 分别输出文本中的第二项 第一项内容
$ cat words.txt|xargs -n 1 echo|uniq -c |sort -n -r |awk '{print $2,$1}'

输出结果如下:
QGKwnK.png

posted @ 2019-12-05 20:46  晚安,Jake  阅读(1283)  评论(0编辑  收藏  举报