摘要:
前言.Net 下分词组件选择不多,最近看到宝玉发布了改进版本的mmseg分词,正好跟使用已久的盘古分词做个对比。盘古是用自动机来实现分词,更详细的分析http://www.cnblogs.com/eaglet/archive/2008/10/02/1303142.htmlmmseg的算法相对先进一些,更详细的解释:http://www.coreseek.cn/opensource/mmseg/这里只对比盘古默认的配置,因为默认中不打开一元分词已经满足需求,mmseg只对比maxword的配置,目标是多元分词的效率和效果。效率对比硬件配置:CPU i7 2.3GHz RAM 4GB盘古分词官方效 阅读全文