lucene-01-简介

1, 介绍

hadoop作者开发的

hdfs最开始作为netch的文件存储来使用的

2, 存储结构

lucene快的原因, 是因为添加数据的时候会对数据进行分词, 将分词后的词建立索引,

  存储到索引库中, 然后将真正的内容即文档保存起来, 存储在文档中 

查找时, 将查询条件分词, 先在索引库中查找, 如果查找到会返回 document_id, 然后根据文档id再到

  存储文档的区域, 查找真正的内容

 3, 数据库和全文检索的区别

数据库 模糊查询不走index, 速度慢, 不准确

全文检索: 快速, 准确的找到想要的数据

  快: 先从索引库中查找 

  准: 对查询条件进行分词, 然后对查询的结果进行相关度查询

 

posted @ 2018-07-31 19:57  bronk  阅读(146)  评论(0编辑  收藏  举报