摘要: 概念说明:同义词大体的意思是指,当用户输入一个词时,solr会把相关有相同意思的近义词的或同义词的term的语段内容从索引中取出,展示给用户,提高交互的友好性(当然这些同义词的定义是要在配置文件中事先定义好的),比如:用户输入:日本,那么就可能有一些相关的近义词如:鬼子,屠杀,战犯等的词,这个可在配... 阅读全文
posted @ 2014-07-02 14:15 飞扬的薰衣草 阅读(291) 评论(0) 推荐(0) 编辑
摘要: Java中有一些开源的分词项目,比如:IK、Paoding、MMSEG4J等等。这里主要说的是MMSEG4J中使用的MMSeg算法。它的原文介绍在:http://technology.chtsai.org/mmseg/,是用英文书写的,这是只是它的一个中文笔记。为什么中文要分词中文和英文的书写方式不... 阅读全文
posted @ 2014-07-02 10:18 飞扬的薰衣草 阅读(316) 评论(0) 推荐(0) 编辑