solr学习之域的管理与中文分析器配置
摘要:该文使用 Centos6.5 64 位 solr4.10.3 IK-Analyzer中文分析器 一、solr域 在solr中域的概念与lucene中域的概念相同,数据库的一条记录或者一个文件的信息就是一个document,数据库记录的字段或者文件的某个属性就是一个Field域,solr中对索引的检索
阅读全文
posted @
2018-10-31 16:02
宏宇
阅读(468)
推荐(0) 编辑
Solr进阶之Solr综合文本相似度的多因素权重排序实现
摘要:现在有个需求是这样子的:需要计算搜索词的权重设置其为总排序权重的0.6,其他因素的权重为0.4其他因素中还有详细的划分.这里我们用Solr如何来实现?众所周知solr默认的排序方式为按照文本相似度来进行降序排列的,现在我们要将打分的Score作为排序的一个因子来利用.就需要单独的获取到Score.网
阅读全文
posted @
2018-10-30 11:08
宏宇
阅读(938)
推荐(0) 编辑
Solr之精确、匹配、排序、模糊查询-yellowcong
摘要:Solr查询数据,其实下面一堆的参数,我也没有做测试,只是转载过来了,我大概只用了高亮、排序、查询、分页,其他的好像没有用过,以后用再来查 一.基本查询 二. Solr的检索运算符 三. 高亮 是否高亮,hl=true,表示采用高亮 设定高亮显示的字段,用空格或逗号隔开的字段列表。要启用某个字段的h
阅读全文
posted @
2018-10-30 11:02
宏宇
阅读(7751)
推荐(0) 编辑
.net Elasticsearch 学习入门笔记
摘要:一. es安装相关1.elasticsearch安装 运行http://localhost:9200/2.head插件3.bigdesk插件安装(安装细节百度:windows elasticsearch 安装,有详细内容) 二. es插件相关http://www.searchtech.pro/ela
阅读全文
posted @
2018-10-29 11:39
宏宇
阅读(205)
推荐(0) 编辑
Solr vs. Elasticsearch谁是开源搜索引擎王者
摘要:当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求。随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战。本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch。两者都建立在Apache
阅读全文
posted @
2018-10-29 11:09
宏宇
阅读(413)
推荐(0) 编辑
搜索引擎选择: Elasticsearch与Solr
摘要:Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础
阅读全文
posted @
2018-10-29 11:02
宏宇
阅读(300)
推荐(0) 编辑
Solr中的日期/时间表示
摘要:摘要: Solr的日期字段(TrieDateField 和DateRangeField)可以对一个时间点以毫秒精度表示。 格式 Solr中的日期有很严格的格式限制: YYYY-MM-DDThh:mm:ssZ YYYY 表示年 MM 表示月份 DD 表示天 hh 表示小时,24小时制 mm 表示分钟
阅读全文
posted @
2018-10-18 19:25
宏宇
阅读(2829)
推荐(0) 编辑
Solr使用in语法查询
摘要:Solr可以用AND、|| 布尔操作符 表示查询的并且, 用OR、&& 布尔操作符 表示或者 用NOT、!、-(排除操作符不能单独与项使用构成查询)表示非 如果要用在查询的时候使用类似sql的in(1,2,3,4) 可以这样post_id:(1 2 3 4)(每个id之间加空格)或者post_id:
阅读全文
posted @
2018-10-09 11:07
宏宇
阅读(1296)
推荐(0) 编辑
Solr高效利用:Solr实现SQL的查询与统计
摘要:1.如何高效使用Solr查询功能 ?2.单个字段分组统计如何实现? 3.IN条件查询有几种方式? 4.多个字段分组统计是否只支持count?Cloudera公司已经推出了基于Hadoop平台的查询统计分析工具Impala,只要熟悉SQL,就可以熟练地使用Impala来执行查询与分析的功能。不过Imp
阅读全文
posted @
2018-10-09 11:06
宏宇
阅读(2245)
推荐(0) 编辑
使用Solrj 获取语句分词结果的代码
摘要:import java.util.ArrayList; import java.util.Iterator; import java.util.List; import org.apache.log4j.Logger; import org.apache.solr.client.solrj.impl.HttpSolrServer; import org.apache.solr.client.so...
阅读全文
posted @
2018-09-19 17:09
宏宇
阅读(404)
推荐(0) 编辑
solr7.1.0学习笔记(10)---Solr发布到Tomcat
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_39082031/article/details/79069554 将solr作为一个单独的项目发布到 Tomcat 可没有我们普通的项目发布到 Tomcat 那么简单,从5.0.0版本开
阅读全文
posted @
2018-09-03 15:55
宏宇
阅读(389)
推荐(0) 编辑
JavaEE进阶——全文检索之Solr7.4服务器
摘要:I. Solr Solr简介 Solr是Apache的顶级开源项目,使用java开发 ,基于Lucene的全文检索服务器。 Solr比Lucene提供了更多的查询语句,而且它可扩展、可配置,同时它对Lucene的性能进行了优化。 Solr的全文检索流程 索引流程: Solr客户端(浏览器、java程
阅读全文
posted @
2018-09-03 15:53
宏宇
阅读(519)
推荐(0) 编辑
solr7.4 tomcat环境下搭建(windows)
摘要:-版本solr-7.4.0 -环境 Windows jdk1.8 -启动方式:部署在apache-tomcat-8.5.28,以下简称Tomcat 1. 将solr-7.4.0\server\solr-webapp下的webapp复制到Tomcat\webapps下,并改名solr; 2. 将sol
阅读全文
posted @
2018-09-03 15:52
宏宇
阅读(478)
推荐(0) 编辑
solr7.4 安装与使用
摘要:1.solr7环境要求 solr7需要java8环境,且需要在环境变量中添加 JAVA_HOME变量。 2.solr 安装 下载地址 https://lucene.apache.org/solr/mirrors-solr-latest-redir.html 我下载为7.4版本 在solr5以前sol
阅读全文
posted @
2018-09-03 14:40
宏宇
阅读(343)
推荐(0) 编辑
Solr DocValues详解
摘要:前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一定的磁盘空间带来的好处主要有两个: (1)节省内存 (2)对排序,分组和一些聚合操作时能够大大提升性能 下面来详细介绍
阅读全文
posted @
2018-08-23 11:42
宏宇
阅读(2480)
推荐(0) 编辑
Solr查询参数sort(排序)
摘要:摘要: Solr查询每一次返回的数据都有一定的顺序,特定顺序的结果对于业务来说可能非常重要。 不指定排序 一般我们不指定排序规则,这样的结果能满足大部分需求,默认是用文档的得分作为排序标准。相当于加上了参数sort=score desc,这里的score是solr的一个隐藏字段,衡量这个文档对于该查
阅读全文
posted @
2018-08-23 09:53
宏宇
阅读(5996)
推荐(0) 编辑
Solr合并索引方式
摘要:索引合并并不会判断uniqueKey,所以主键有重复不会判断主键会重复。 官方的解释是不要有重复。 要合并索引,它们必须满足以下要求: 这两个索引必须兼容:它们的架构应该包含相同的字段,并且它们应该以相同的方式分析字段。 索引不得包含重复的数据。 1, Solr 合并索引数据有两种方法,第一种是 1
阅读全文
posted @
2018-08-21 17:01
宏宇
阅读(470)
推荐(0) 编辑
solr研磨之游标分页
摘要:作者:战斗民族就是干 转载请注明地址:http://www.cnblogs.com/prayers/p/8986498.html 普通分页 当需要深度分页的时候,比如查询第10000页数据,每页显示10条,意味着需要提取前10000 x 10 页的数据,并将这100000条数据缓存在内存中,然后在内
阅读全文
posted @
2018-08-21 13:51
宏宇
阅读(316)
推荐(0) 编辑
solr研磨之性能调优
摘要:作者:战斗民族就是干 转载请注明地址:http://www.cnblogs.com/prayers/p/8982141.html 本篇文章我们来了解一下solr的性能方面的调优,分为Schema优化、索引更新与提交调优、索引合并性能调优、Solr缓存、Solr查询性能优化 Schema优化 1、in
阅读全文
posted @
2018-08-21 13:50
宏宇
阅读(830)
推荐(0) 编辑
solr研磨之facet
摘要:作者:战斗民族就是干 转载请注明地址:http://www.cnblogs.com/prayers/p/8822417.html Facet 开门见山,facet解决的就是筛选,我是把它理解为一种聚合。 例如,商品属性中的品牌名称。例如:搜索召回了100个sku,这100个sku里面包含在20个品牌
阅读全文
posted @
2018-08-21 13:50
宏宇
阅读(186)
推荐(0) 编辑