相信你一定听过这样的说法:

80%的财富集中在20%的人手中……

80%的用户只使用20%的功能……

20%的用户贡献了80%的访问量……

…………

你知道我在说“二八原则”或“20/80原则”,是的,没错!

-----------

如果把所有的单词(字)放在一起看呢?会不会20%的词(字)占了80%的出现次数?答案是肯定的。

早在上个世纪30年代,就有人(Zipf)对此作出了研究,并给出了量化的表达——齐普夫定律(Zipf's Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是 r × f = C 。

Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。现在zipf定律已经被应用到各行各业(看这里)。

参考文献:

姜望琪 《Zipf与省力原则》

徐兴余 《20/80律与布-齐-洛三个定律之间的关系》

   


类别:学习 查看评论
文章来源:http://hi.baidu.com/yuxiaosong/blog/item/5e8662d02fa6b38ba1ec9c2f.html