摘要: stanford corenlp的中文切词有时不尽如意,那我们就需要实现一个自定义切词类,来完全满足我们的私人定制(加各种词典干预)。上篇文章《IKAnalyzer》介绍了IKAnalyzer的自由度,本篇文章就说下怎么把IKAnalyzer作为corenlp的切词工具。 《stanford cor 阅读全文
posted @ 2016-12-09 15:34 春文秋武 阅读(3009) 评论(0) 推荐(0) 编辑
摘要: 我们的项目中中文切词使用的是mmseg,有一个不满意的地方是jar包中的默认词典一定会被加载进去,当我对有些term有意见时,无法删除。 mmseg中Dictionary.java里一段代码保证了/data/words.dic的加载,我无法提供自己的进行替换。 而IKAnalyzer就比较自由,既可 阅读全文
posted @ 2016-12-09 15:21 春文秋武 阅读(726) 评论(0) 推荐(0) 编辑