摘要: http://blog.csdn.net/chaocy/article/details/5938741对自己挺有用的一篇文章,先收藏着哈。对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。单纯的中文分词的实现一般为按字索引或者按词索引。按字索引顾名思义,就是按单个字建立索引。按词索引就是按词喽,根据词库中的词,将文字进行切分。车东的交叉双字分割或者叫二元分词我觉得应该算是 阅读全文
posted @ 2013-04-25 22:53 涵秋 阅读(678) 评论(0) 推荐(0) 编辑