天下第二博

Tian Xia The Second BO
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2009年6月17日

摘要: 1. Lucene. 他是一个全文搜索引擎工具包,但只支持文本文件以及少量语种的索引; 通过Lucene提供的接口, 我们可以自己开发具体语言的分词器, 针对具体文档的文本解析器等; Lucene是索引数据结构事实上的标准; 使用Java编写, 但是被转化为多个库; 阅读全文

posted @ 2009-06-17 15:24 Nuke'Blog 阅读(2118) 评论(0) 推荐(1) 编辑