文章分类 -  搜索引擎开发相关

摘要:但是用词库的分词,准确性暂且不说,词库的更新,索引就必须跟着改变。这种方式无疑是成本高昂的。那么StandardAnalyzer分词的优点还是有的。是否可以结合这两种分词的优点呢? 阅读全文
posted @ 2008-08-03 03:33 Birdshover 阅读(2884) 评论(18) 推荐(0) 编辑
摘要:自己做分词,一般选择继承Tokenizer类。在以前的版本中只需要重写Next()方法就可以了。这个类比较简单,而塔的父类TokenStream则更加简单了,和接口没什么两样: Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->//2.1版 publ... 阅读全文
posted @ 2008-07-23 14:59 Birdshover 阅读(1891) 评论(0) 推荐(0) 编辑
摘要:昨天说了索引时,如何在Lucene.Net中一个Document使用不同的分词。 今天讲的搜索时使用不同分词。 阅读全文
posted @ 2008-07-22 20:36 Birdshover 阅读(3553) 评论(13) 推荐(0) 编辑