摘要: 1.1. 先介绍下什么是solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 Solr可以独立运行,运行在Jetty、Tomcat等这些 阅读全文
posted @ 2018-11-21 19:08 人生如&逆旅 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 1.1. 实现步骤 第一步:创建一个Directory对象,也就是索引库存放的位置。 第二步:创建一个indexReader对象,需要指定Directory对象。 第三步:创建一个indexsearcher对象,需要指定IndexReader对象 第四步:创建一个TermQuery对象,指定查询的域 阅读全文
posted @ 2018-11-20 15:14 人生如&逆旅 阅读(1460) 评论(0) 推荐(0) 编辑
摘要: 使用indexwriter对象创建索引 1.1. 实现步骤 第一步:创建一个java工程,并导入jar包。 第二步:创建一个indexwriter对象。 1)指定索引库的存放位置Directory对象 2)指定一个分析器,对文档内容进行分析。 第二步:创建document对象。 第三步:创建fiel 阅读全文
posted @ 2018-11-19 17:36 人生如&逆旅 阅读(1142) 评论(0) 推荐(0) 编辑
摘要: 1.1. 索引和搜索流程图 1、绿色表示索引过程,对要搜索的原始内容进行索引构建一个索引库, 索引过程包括:确定原始内容即要搜索的内容->采集文档->创建文档->分析文档->索引文档 2、红色表示搜索过程,从索引库中搜索内容, 搜索过程包括:用户通过搜索界面->创建查询->执行搜索,从索引库搜索-> 阅读全文
posted @ 2018-11-18 15:59 人生如&逆旅 阅读(791) 评论(0) 推荐(0) 编辑
摘要: 1.1. 数据分类 数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件 1.2. 非结构化数据查询方法 (1)顺序扫描法(Serial Scanning) 顺序扫 阅读全文
posted @ 2018-11-18 15:37 人生如&逆旅 阅读(546) 评论(0) 推荐(0) 编辑