随笔分类 -  全文检索Lucene & Solr & Elasticsearch

Lucene & Solr & Elasticsearch
摘要:1 准备工作 1.1 下载安装包 安装包下载地址:https://www.elastic.co/cn/downloads/ 这里下载并将安装包统一解压后的目录结构如下: 1.2 修改文件限制 1.3 调整进程数 1.4 调整虚拟内存&最大并发连接 1.5 jdk版本 Elasticsearch5之后 阅读全文
posted @ 2019-12-30 00:26 雪山上的蒲公英 阅读(950) 评论(1) 推荐(0) 编辑
摘要:1. Schema.xml 在schema.xml文件中,主要配置了solrcore的一些数据信息,包括Field和FieldType的定义等信息,在solr中,Field和FieldType都需要先定义后使用。 1.1 Filed(定义Field域) Name:指定域的名称 Type:指定域的类型 阅读全文
posted @ 2017-10-15 16:48 雪山上的蒲公英 阅读(402) 评论(0) 推荐(0) 编辑
摘要:1. Dashboard 仪表盘,显示了该Solr实例开始启动运行的时间、版本、系统资源、jvm等信息。 2. Logging Solr运行日志信息 3. Cloud Cloud即SolrCloud,即Solr云(集群),当使用Solr Cloud模式运行时会显示此菜单。 注意:在进行solrclo 阅读全文
posted @ 2017-10-15 00:53 雪山上的蒲公英 阅读(484) 评论(0) 推荐(0) 编辑
摘要:1. solr简介 1.1 Solr是什么 Solr是apache的顶级开源项目,它是使用java开发 ,基于lucene的全文检索服务器。 Solr和lucene的版本是同步更新的,最新的版本是7.0.1。下载地址:http://archive.apache.org/dist/lucene/sol 阅读全文
posted @ 2017-10-10 18:30 雪山上的蒲公英 阅读(486) 评论(0) 推荐(0) 编辑
摘要:1. 什么是中文分词器 对于英文,是安装空格、标点符号进行分词 对于中文,应该安装具体的词来分,中文分词就是将词,切分成一个个有意义的词。 比如:“我的中国人”,分词:我、的、中国、中国人、国人。 2. Lucene自带的中文分词器 StandardAnalyzer: 单字分词:就是按照中文一个字一 阅读全文
posted @ 2017-10-09 00:12 雪山上的蒲公英 阅读(831) 评论(0) 推荐(0) 编辑
摘要:1. 搜索 1.1 创建查询对象的方式 通过Query子类来创建查询对象 Query子类常用的有:TermQuery、NumericRangeQuery、BooleanQuery 特点:不能输入lucene的查询语法,不需要指定分词器 通过QueryParser来创建查询对象(常用) QueryPa 阅读全文
posted @ 2017-10-08 23:13 雪山上的蒲公英 阅读(851) 评论(0) 推荐(0) 编辑
摘要:1. Field域 1.1 Field的属性 是否分词(Tokenized) 是:对该field存储的内容进行分词,分词的目的,就是为了索引。 比如:商品名称、商品描述、商品价格 否:不需要对field存储的内容进行分词,不分词,不代表不索引,而是将整个内容进行索引。 比如:商品id 是否索引(In 阅读全文
posted @ 2017-10-08 22:29 雪山上的蒲公英 阅读(1325) 评论(0) 推荐(0) 编辑
摘要:完成需求:使用Lucene完成对数据库中图书信息的索引和搜索功能。 1. 环境准备及工程搭建 1.1 环境准备 mysql5.5+java8+lucene4.10.3(目前最新7.0.1,这里够用就好) 需要注意:lucene从4.8版本以后,必须使用jdk1.7及以上。 1.2 工程搭建 Mysq 阅读全文
posted @ 2017-10-08 18:07 雪山上的蒲公英 阅读(794) 评论(0) 推荐(0) 编辑
摘要:1. Lucene是什么 Lucene 是一个基于 Java 的全文信息检索 工具包 ,它不是一个完整的搜索应用程序,而是为你的应用程序 提供索引和搜索功能 。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 2. 全文 阅读全文
posted @ 2017-10-08 15:21 雪山上的蒲公英 阅读(867) 评论(1) 推荐(1) 编辑

/* 返回顶部代码 */
点击右上角即可分享
微信分享提示