一、lucene+盘古分词

Lucene.Net只是一个全文检索开发包。它的功能就是提供了全文检索功能的一个数据库。Lucene.Net不管文本数据怎么来的,用户可以基于Lucene.Net开发满足自己需求的搜索引擎。Lucene.Net智能对文本信息进行检索。如果不是文本信息,要转换为文本信息,比如检索Excel文件,就要用NPOI把Excel读取成字符串,然后把字符串扔给Lucene.Net。Lucene.Net会把扔给它的文本切词保存,加快检索速度。

盘古分词使用方法:
将Dict文件夹放置项目根目录,并将其下文件"复制到输出目录"属性设置为"如果较新则复制"
引用PanGu.dll与PanGu.Lucene.Analyzer.dll类库即可使用盘古分词算法
添加引用:PanGu.HighLight.dll

  lucene 官方网站Luncene.net 官方网站(英文) 这两个网站大家应该都知道了,里面还有一个邮件列表,有兴趣可以加入这个邮件列表,这样就可以和全球的爱好者一起来讨论Lucene.net的相关问题了。
    中文资源
    博客园 lucene.net 讨论小组 一个园子里面的,当然要重点推荐一下了。
    博客园 搜索引擎讨论小组 我创建的小组,主要讨论搜索引擎技术,数据挖掘技术和中文分词技术,由于和lucene高度相关,所以一些lucene的问题也会在这个小组中进行讨论。
    Nutch中文网论坛 Lucene学习资料
    JavaEye lucene爱好者

 

    英文资源   

  lucene apache 组织中的 wiki 这个网址有很多lucene 的相关资源

    lucene 的英文博客网站 这个是lucene的鼻祖Doug Cutting的Blog   

  维基百科Lucene相关的介绍   

  Lucene forum at nabble.com   

  http://groups.drupal.org/lucene-and-nutch

    http://lucene.grantingersoll.com/

    Lucene.Net Resource List – Books, links and API’s

 

posted @ 2016-03-23 11:05  enjoy菊香  阅读(379)  评论(0编辑  收藏  举报