Lucene学习笔记之一:信息检索与全文检索

信息检索的概念

信息检索就是从信息集合中找出与用户需求相关的信息。被检索出的信息除了文本外,还有图像、音频、视频等多媒体信息。

 

信息检索技术的分类

目前信息检索技术可分为3类:

l  全文检索:把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配。在信息检索工具中,全文检索是最具通用性和实用性的。

l  数据检索:查询要求和信息系统中数据都遵循一定的格式,具有一定的结构,允许对特定的字段检索。其性能与使用有很多的局限性,并且支持语义匹配的能力较差。

l  知识检索:调用的是用于知识的、语义上的匹配。

 

全文检索与数据库查询对比

全文搜索出现的目的就是为了更快地查找信息

数据库查询效率低(例如拿一本字典来一页一页找,效率肯定很低)

全文搜索是按索引来找,效率高(从字典的索引找,再找到哪一页,效率会高)

 

本文链接:Lucene学习笔记之一:信息检索与全文检索,由huangyineng原创,转载请注明出处

posted @ 2013-05-04 10:12  javastudy2013  阅读(129)  评论(0编辑  收藏  举报