摘要:
上文找到了 collect(…) 方法,其形参就是匹配的文档 Id,根据代码上下文,其中 doc 是由 iterator.nextDoc() 获得的,那 DefaultBulkScorer.iterator 是何时赋值的?代码如下。 构造函数中 scorer.iterator() 即为匹配的文档 I 阅读全文
摘要:
综述 可以直接根据 hashcode 值判断两个对象是否相等吗?肯定是不可以的,因为不同的对象可能会生成相同的 hashcode 值。虽然不能根据 hashcode 值判断两个对象是否相等,但是可以直接根据 hashcode 值判断两个对象不等,如果两个对象的 hashcode 值不等,则必定是两个 阅读全文
摘要:
倒排索引是 Lucene 的核心数据结构,该系列文章将从源码层面(源码版本: "Lucene 7.3.0" )分析。该系列文章将以如下的思路展开。 1. 什么是倒排索引? 2. 如何定位 Lucene 中的倒排索引? 3. 倒排索引是如何搜索的? 4. 倒排索引是如何增删改的? 本文将介绍什么是倒排 阅读全文
摘要:
本文以及后面几篇文章将讲解如何定位 Lucene 中的倒排索引。内容很多,唯有静下心才能跟着思路遨游。 我们可以思考一下,哪个步骤与倒排索引有关,很容易想到检索文档一定是要查询倒排列表的,那么就从此处入手。检索文档通过调用 IndexSearcher.search(Query query, int 阅读全文
摘要:
1.环境概述 虚拟机系统:CentOS Linux release 7.3.1611 (Core) 宿主机系统:Mac Sierra version 10.12.3 nginx:1.10.3 php:7.1.2 mysql:5.7 zabbix:3.2.4 2.elasticsearch a.下载 阅读全文
摘要:
1.环境概述 虚拟机系统:CentOS Linux release 7.3.1611 (Core) 宿主机系统:Mac Sierra version 10.12.3 nginx:1.10.3 php:7.1.2 mysql:5.7 zabbix:3.2.4 2.mysql a.安装准备 安装mysq 阅读全文
摘要:
1.环境概述 虚拟机系统:CentOS Linux release 7.3.1611 (Core) 宿主机系统:Mac Sierra version 10.12.3 nginx:1.10.3 php:7.1.2 2.虚拟机 为了使得虚拟机和主机互通且虚拟机能联网,在安装系统之前需要设置网络。在当前虚 阅读全文
摘要:
NRT(近实时搜索) Elasticsearch是一个NRT平台。这意味着当你索引一个文件时,在细微的延迟(通常1s)之后,该文件才能被搜索到。 NRT(近实时搜索) Elasticsearch是一个NRT平台。这意味着当你索引一个文件时,在细微的延迟(通常1s)之后,该文件才能被搜索到。 Clus 阅读全文
摘要:
简单版示例: 2.x版本(相比于1.x版本,使用bool替代filtered,使用must替代query) 1.x版本 完全版示例: 阅读全文
摘要:
创建索引 无mapping 创建索引名称为index的索引 curl -XPUT http://localhost:9200/book 有mapping 如果需要定义每个类型的结构映射,创建type名称为user和blogpost的mapping。 curl -XPUT "http://localh 阅读全文
摘要:
管理页面 页面地址:http://{ip}:{port}/solr/#/ 管理页面的data-import页可以手动重建索引,configuration指定了数据源,重建索引也可以通过http请求触发: http://{ip}:{port}/solr/{coreName}/dataimport?co 阅读全文
摘要:
当用户在浏览器中输入域名并按下回车键后,DNS解析会有如下7个步骤 浏览器缓存 浏览器会检查缓存中有没有这个域名对应的解析过的IP地址,如果缓存中有,这个解析过程就将结束。浏览器缓存域名也是有限制的,不仅浏览器缓存大小有限制,而且缓存的时间也有限制,通常情况下为几分钟到几小时不等,户名被缓存的时间限 阅读全文
摘要:
mac下virtualbox实现主机和虚拟机、虚拟机和外网互访的方案 Adapter DHCP Server 其中DHCP地址前缀保持和主机虚拟前缀保持一致 默认配置即可 选择第1步配置的Host-Only网络,其他默认 阅读全文
摘要:
一.基本使用 双引号 代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。 例如: “javar高性能程序开发” 减号 代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的 阅读全文
摘要:
原文地址 三叉搜索树是用来解决字典树的内存问题的数据结构。为了避免不需要的节点的内存占用,每个字典树节点不再使用数组,而是使用“树中有树”的结构。在三叉搜索树中,字典树节点的每个非空指针得到它自己。 例如,有四个单词,AB、ABBA、ABCD和BCD,它的三叉搜索树结构如下: 三叉搜索树包括三种箭头 阅读全文
摘要:
一 基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现。它本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态。在词典中这此状态包括“词前缀”,“已成词”等。 双数组Trie(dou 阅读全文
摘要:
回归分析是一种应用极为广泛的数量分析方法,主要用于确定2种或2种以上变量间相互依赖的定量关系。回归分析的基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。建立线性回归模型后,根据实测数据求解模型的各个参数,然后评价回归模型能否很好地拟合 阅读全文
摘要:
1.启动和关闭 a.启动和重启 启动和重启命令有很多选项让你运行在SolrCloud模式,使用示例配置,以hostname为开头或者非默认端口,指向本地ZooKeeper。 当使用重启命令,必须传入当初启动时的所有参数。Solr重启之前将被关闭。如果没有节点正在运行,restart将跳过关闭,直接启 阅读全文
摘要:
搞定这个的过程远比想象的困难许多。网上许多教程,一一尝试,大多随着库版本的改变以及浏览器对协议支持的改变以失败告终,即使成功的也语焉不详,以下为步骤。 1. 运行环境 Java EE IDE apache-tomcat-7.0.29(7.0.27之后才支持websocket) IE(版本:10.0. 阅读全文