文章分类 - 搜索引擎开发相关
摘要:但是用词库的分词,准确性暂且不说,词库的更新,索引就必须跟着改变。这种方式无疑是成本高昂的。那么StandardAnalyzer分词的优点还是有的。是否可以结合这两种分词的优点呢?
阅读全文
摘要:自己做分词,一般选择继承Tokenizer类。在以前的版本中只需要重写Next()方法就可以了。这个类比较简单,而塔的父类TokenStream则更加简单了,和接口没什么两样: Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->//2.1版 publ...
阅读全文
摘要:昨天说了索引时,如何在Lucene.Net中一个Document使用不同的分词。
今天讲的搜索时使用不同分词。
阅读全文