09 2020 档案
摘要:一、分词器 1、作用:①切词 ②normalizaton(提升recall召回率:能搜索到的结果的比率) 2、分析器 ①character filter:分词之前预处理(过滤无用字符、标签等,转换一些&=>and 《Elasticsearch》=> Elasticsearch A、HTML Stri
阅读全文
摘要:一、Painless 1、Painless是一种专门用于Elasticsearch的简单,用于内联和存储脚本,类似于Java,也有注释、关键字、类型、变量、函数等,安全的脚本语言。它是Elasticsearch的默认脚本语言,可以安全地用于内联和存储脚本。 2、语法 POST /product2/_
阅读全文
摘要:一、正排索引 1、倒排索引的优势在于查找包含某个项的文档,如果用它确定哪些项是否存在文档中那么就使用正排索引 2、区别正排索引和倒排索引 3、doc_value与fielddata 二、基于mget批量查询以及基于bulk的批量增删改 1、mget:批量查询 GET /<index>/_mget G
阅读全文
摘要:1、概念:mapping就是ES数据字段field的type元数据,ES在创建索引的时候,dynamic mapping会自动为不同的数据指定相应mapping,mapping中包含了字段的类型、搜索方式(exact value或者full text)、分词器等。 2、查看mapping:GET /
阅读全文
摘要:一、Searchtimeout 1、 设置:默认没有timeout,如果设置了timeout,那么会执行timeout机制。 2、Timeout机制:假设用户查询结果有1W条数据,但是需要10″才能查询完毕 用户设置了1″的timeout 那么不管当前一共查询到了多少数据,都会在1″后ES讲停止查询
阅读全文
摘要:一、ES横向扩容方案 横向扩容方案一: 横向扩容方案二: 二、ES容错机制 1、容错:各种情况下都能保证工作正常运行 在局部出错异常的情况下,保证服务正常运行并且有自行恢复能力 2、ES的角色 ① Master:主节点,每个集群都有且只有一个 尽量避免Master节点 node.data = tru
阅读全文
摘要:elastic.co 一、什么是搜索? 通过一个关键词或一段描述,得到你想要的(相关度高)结果 二、如何实现搜索功能? 关系型数据库:性能差、不可靠、结果不准确(相关度很低) 使用mysql数据库时,建立索引会加快查询效率(索引会对字段进行排序) 但若使用模糊查询:select * from emp
阅读全文
摘要:数据库连接池的目的 为了减少频繁开关连接的时间,提高整个系统的相应能力 通过分析发现应该具备几个属性值: 1、初始大小 2、每次扩容的大小 3、连接池的最大个数 4、空闲连接的死亡时间 各种数据库连接池 1、DBCP(基本不用) 2、C3P0 注意: 一般不会在代码中直接设置数据库相关的属性值 这些
阅读全文