Shell 命令实现词频统计

杨贵福老师的方法

  1. cat tr sed sort head 命令的综合使用方式1
$ cat pg11.txt |tr -cs A-Za-z\' '\n' |sed "/'/d"| tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head


结果为:

    1797 the
    884 and
    804 to
    679 a
    619 of
    537 she
    515 it
    462 said
    423 in
    395 you

\2. cat tr sed sort head 命令的综合使用方式2 (PS:刚刚加了sed这一条,用于删除 ' 这个被匹配的单词)

$ cat pg11.txt |tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head


结果为:


   1797 the
    884 and
    804 to
    679 a
    619 of
    537 she
    515 it
    462 said
    423 in
    395 you

posted on 2016-03-22 09:46  小林觉  阅读(1423)  评论(3编辑  收藏  举报

导航