使用Sphinx的wordforms属性设置词干搜索、简体繁体混合搜索、拼音搜索汉字等方法技巧
摘要:
Sphinx索引配置文件有个wordfroms属性,wordfroms对应的是一个简单的字典文本文件,供sphinx在索引和搜索的时候替换词语使用。作用本质上,就是将一个词替换成另一个。这通常被用来将不同的词形变成一个单一的标准形式(即将词的各种形态如“walks”,“walked”,“walking”变为标准形式“walk”)。例如:walks>walkwalked>walkwalking>walk也可以用来实现取词根的例外情况,因为词形字典中可以找到的词不会经过词干提取器的处理。 索引和搜索中的输入词都会利用词典做规则化。因此要使词形字典的更改起作用,需要重新索引并重启s 阅读全文
posted @ 2014-01-10 13:49 阿杜0409 阅读(740) 评论(0) 推荐(0) 编辑