Shell 命令实现词频统计
杨贵福老师的方法
- cat tr sed sort head 命令的综合使用方式1
$ cat pg11.txt |tr -cs A-Za-z\' '\n' |sed "/'/d"| tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head
结果为:
1797 the
884 and
804 to
679 a
619 of
537 she
515 it
462 said
423 in
395 you
\2. cat tr sed sort head 命令的综合使用方式2 (PS:刚刚加了sed这一条,用于删除 ' 这个被匹配的单词)
$ cat pg11.txt |tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head
结果为:
1797 the
884 and
804 to
679 a
619 of
537 she
515 it
462 said
423 in
395 you