java的英文词频算法

java实现的英文词频算法,通常是采用单词树来实现的。使用java实现词频统计,
为了统计词汇出现频率,最简单的做法是再建立一个map,其中,key是单词,value
代表次数。
将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次
数加一,没查到则放到map中。这样虽然代码简单,但却达不到想要的效果,通过
性能的测试看出性能却非常差。从时间复杂度来说map时间复杂度是0(logn),
如果拿来高频词需要进行排序,即使在结构优化,但最后还是不能很大的性能提高。

     

posted @ 2016-11-27 16:14  handsomeman  阅读(861)  评论(0编辑  收藏  举报