摘要:
先建立es的mapping,也就是建立在es中建立一个空的Index,代码如下:执行后就会在es建lagou 这个index。 from datetime import datetime from elasticsearch_dsl import DocType, Date, Nested, Boolean, \ analyzer, InnerD... 阅读全文
摘要:
主要知识点 优化写入流程实现近实时 优化写入流程实现持久化和数据恢复 优化写入流程实现海量磁盘文件合并 一、优化写入流程实现近实时 在第68节中写到了es写入document所要经历的步骤,这个流程有一个问题,那就是每次都必须等待fsync将segment刷入磁盘,才能将segment打开供search使用,这样的话,从一个document写入es直到它可以... 阅读全文
摘要:
主要知识点 document增的原理 document删的原理 document改的原理 一、document增的原理 一个document存入es大致要分以下几个步骤 (1)数据写入buffer, (2)写入buffer的数据在达到一定条件(时间等)进行commit point(提交点) (3)b 阅读全文
摘要:
倒排索引,是适合用于进行搜索的,倒排索引的结构是比较复杂的,总体来说包括以下几个部分 (1)包含这个关键词的document list (2)包含这个关键词的所有document的数量:IDF(inverse document frequency) (3)这个关键词在每个document中出现的次数:TF(term frequency) (4)这个关键词在这个document中的次序... 阅读全文
摘要:
主要知识点: 理解reindex的使用场景和必要性 学会reindex 一、理解reindex的使用场景和必要性 假设:在某一个index中依靠dynamic mapping插入数据,但是不小心有些数据是2017-01-01这种日期格式的,所以title这个field被插入2017-01-01这条数据之后就被es自动映射为了date类型,实际上它应该是strin... 阅读全文
摘要:
主要知识点: 理解dynamic mapping 定制dynamic mapping 更改default dynamic mapping 一、理解dynamic mapping 1、基本概念 One of the most important features of Elasticsearch is that it tries to get out of your... 阅读全文