随笔分类 -  SE FTS

Search Engine、Full Text Search:搜索引擎、全文检索技术,介绍Lucene、Compass的使用技术,以及搜索引擎中常用的分词器“简易”、“庖丁”和二分法分词等技术
Lucene 基础理论
摘要:1. 全文检索系统与Lucene简介 1.1 什么是全文检索与全文检索系统 全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。 全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一... 阅读全文
posted @ 2012-09-06 09:32 hoojo 阅读(8779) 评论(0) 推荐(9) 编辑
Lucene 简单手记
摘要:什么是全文检索与全文检索系统? 全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。 全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。... 阅读全文
posted @ 2012-09-05 11:58 hoojo 阅读(4092) 评论(0) 推荐(5) 编辑
Solr开发文档
摘要:Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的全文本搜索功能加入到 Web 应用程序中。 开发环境: System:Windows WebBrowser:IE6+、Firefox3+ JDK:1.6+ JavaEE Server:tomcat5.0.2.8、tom... 阅读全文
posted @ 2011-10-21 16:25 hoojo 阅读(87992) 评论(19) 推荐(34) 编辑