陋室铭
永远也不要停下学习的脚步(大道至简至易)

摘要: 1 分组查询 概述:Solr常用的分组查询有两种,Facet分组和Group分组,分别以下列出这两种查询: 1.1 Facet分组 solr种以导航为目的的查询结果成为facet,在用户查询的结果上根据分类增加了count信息,然后用户根据count信息做进一步搜索, Facet是solr的高级搜索 阅读全文
posted @ 2018-07-19 18:15 宏宇 阅读(2905) 评论(1) 推荐(0) 编辑
摘要: 今天碰到一个问题,数据之前入solr的时候并没有计算条数,现在需要计算出某几个表中去重后的总数。 由于solr的ISearch并没有相关的Distinct功能.想到一个解决方案是用Solr的Facet分组进行GrupBy,但是因为Facet只能返回100条,而数据肯定大于100个分组.所有该方案PA 阅读全文
posted @ 2018-07-19 18:10 宏宇 阅读(677) 评论(0) 推荐(0) 编辑
摘要: Group分组划分结果,返回的是分组结果; Facet分组统计,侧重统计,返回的是分组后的数量; 一、Group用法: //组查询基础配置params.set(GroupParams.GROUP, "true"); params.set(GroupParams.GROUP_FIELD, "dkeys 阅读全文
posted @ 2018-07-19 18:09 宏宇 阅读(607) 评论(0) 推荐(0) 编辑
摘要: 因为我所在的公司为政府做的项目【风险管理系统】,其中涉及大量的统计展示,多数以整个市的区划,行业部门等方式返回,在昨天,我发现听过填报单位的方式返回时,始终只有100个数据。通过对比发现,在前辈的代码中统计的存在一个巧合,就是全市的区划、行业部门钻取的方式都没有超过100,刚好我写的这个接口的填报单 阅读全文
posted @ 2018-07-19 18:06 宏宇 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 首先,不知道大家在前面的例子中没有试着搜索文本串,就是在第二节,我们添加了很多文档。如果字段值是一个文本。你如果只搜索这个字段的某个单词,是不是发现搜不到? 这就是因为我们没有配置Analyzer,因此在搜索的时候会“全匹配”。可以从直观感觉上理解为SQL的 like和= 的区别。 通过前面这段引文 阅读全文
posted @ 2018-07-19 14:52 宏宇 阅读(419) 评论(0) 推荐(0) 编辑
摘要: 一、solr查询,查询配置了查询分词器的字段,默认会对查询关键字做分词处理 1、如查询关键字F1501ZY000011,使用solr7自带的中文分词器,默认会分词为:f,1501,zy,000011 2、不使用defType=edismax参数的查询结果 二、使用参数defType=edismax& 阅读全文
posted @ 2018-07-19 14:16 宏宇 阅读(4860) 评论(0) 推荐(0) 编辑
摘要: 最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧。 有的时候,用户搜索的关键字,可能是一句话,不是很规范。所以在 Solr 中查询出的时候,就需要将用户输入的关键字进行分词。 目前有很多优秀的中文分 阅读全文
posted @ 2018-07-19 14:12 宏宇 阅读(632) 评论(0) 推荐(0) 编辑
摘要: 搜索引擎普遍采用全文检索技术,而其处理的大规模文档本身都是非结构或半结构化信息,文档索引技术是信息全文检索和快速查询的基础。 一、索引概述 索引是一种数据存储的组织结构。索引器用来完成信息索引的建立,维护和管理索引的功能。 倒排索引是一种高效率的索引组织方式,采用字或词作为索引项,能够很好的支持多种 阅读全文
posted @ 2018-07-19 14:10 宏宇 阅读(353) 评论(0) 推荐(0) 编辑
摘要: solr7可能是把默认搜索方式去掉了,如下: 在solr7里找了半天以及各种查资料也没发现这个默认搜索方式,后来想,可能是被edismax里的mm取代了吧,都是控制搜索精度的,如下: 这个mm还是挺解决问题的,但是对于我们公司来说就差那么一点,就一点。就这一点我没有解决。正常情况下这个参数能满足大部 阅读全文
posted @ 2018-07-19 14:09 宏宇 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 使用solr进行某较长词搜索时出现了一些问题,及解决方案。 1、问题:solr默认使用OR方式搜索,当搜索一个很长的次,比如“XX集团股份有限公司”,分词器分词后,使用OR方式匹配,会匹配到很多结果。 解决:然后我使用了AND方式搜索(managed-schema中设置<solrQueryParse 阅读全文
posted @ 2018-07-19 14:08 宏宇 阅读(361) 评论(0) 推荐(1) 编辑
摘要: 摘要: MongoDB 3.0 安全权限访问控制,在添加用户上面3.0版本和之前的版本有很大的区别,这里就说明下3.0的添加用户的方法。 环境、测试: 在安装MongoDB之后,先关闭auth认证,进入查看数据库,只有一个local库,admin库是不存在的: 现在需要创建一个帐号,该账号需要有gr 阅读全文
posted @ 2018-07-19 14:03 宏宇 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 工欲善其事,必先利其器,我们在使用数据库时,通常需要各种工具的支持来提高效率;很多新用户在刚接触 MongoDB 时,遇到的问题是『不知道有哪些现成的工具可以使用』,本系列文章将主要介绍 MongoDB 生态在工具、driver、可视化管理等方面的支持情况。 本文主要介绍 MongoDB 的一些可视 阅读全文
posted @ 2018-07-19 14:02 宏宇 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 又两天没写博客,关于SOLR的东西,写了一周了还没写完我也是醉了,毕竟会的东西真不多,周四晚上加班没写,周五晚上公司同事聚会也没写,今天在家,还是把最后的一点写完吧,我会的剩下的也就是一个对多个表创建索引了,表可以是关联的,也可以是不关联的,下面开始。 一、无关联多表创建索引 1.1数据库准备 首先 阅读全文
posted @ 2018-07-19 13:24 宏宇 阅读(750) 评论(0) 推荐(0) 编辑
摘要: 有2中配置方式,一是从Solr Admin进行multi core的配置。 在Solr Admin控制台里面选择:Core Admin 选择Add Core 然后把你准备好的路径写到里面去。 name: xxx 配置core的名称 instanceDir:xxx 配置指向你的Solr core的路径 阅读全文
posted @ 2018-07-19 13:17 宏宇 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 基于solr或者elasticsearch提供的多核,多索引,多shard等查询能力,一般都是由lucene提供的多索引查询的功能演化而来的,这个功能在单机版的lucene里面确实没有发挥多大的威力,但是确是solrclourd,elasticsearch分布式集群查询数据的基础,正是因为lucen 阅读全文
posted @ 2018-07-19 13:16 宏宇 阅读(3183) 评论(0) 推荐(0) 编辑
摘要: 例如有两个业务表:文章表,评论表 。 场景: 一个文章可以由多个人评论。 创建两个core,一个core叫article,一个叫comment。article实例的schema.xml文件中定义几个简单的属性:id、title、content、createtime,relationId <field 阅读全文
posted @ 2018-07-19 13:15 宏宇 阅读(908) 评论(0) 推荐(0) 编辑
摘要: 参考文档:这里的跨core不使用solrcloud http://wiki.apache.org/solr/CoreAdmin 注意:跨core查询功能相比单core查询,是有限制的 参考文档:这里的跨core不使用solrcloud http://wiki.apache.org/solr/Core 阅读全文
posted @ 2018-07-19 13:14 宏宇 阅读(384) 评论(0) 推荐(0) 编辑
摘要: MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似sql语句中的 count(*)。 基本语法为:db.collection.aggregate( [ <stage1>, <stage2>, ... ] ) 现在在mycol集合中有 阅读全文
posted @ 2018-07-19 13:12 宏宇 阅读(230) 评论(0) 推荐(0) 编辑
摘要: SOLR 删除全部索引数据: <delete><query>*:*</query></delete><commit/> 阅读全文
posted @ 2018-07-19 11:47 宏宇 阅读(393) 评论(0) 推荐(0) 编辑