2018 年 8月 20 日随笔档案 - 小人物的奋斗

ES系列九、ES优化聚合查询之深度优先和广度优先

摘要： 1.优化聚合查询示例假设我们现在有一些关于电影的数据集，每条数据里面会有一个数组类型的字段存储表演该电影的所有演员的名字。 { "actors" : [ "Fred Jones", "Mary Jane", "Elizabeth Worthing" ] } 如果我们想要查询出演影片最多的十个演员以阅读全文

posted @ 2018-08-20 23:27 小人物的奋斗阅读(4205) 评论(0) 推荐(1) 编辑

ES系列八、正排索Doc Values和Field Data

摘要： 1.Doc Values 聚合使用一个叫Doc Values的数据结构。Doc Values使聚合更快、更高效且内存友好。 Doc Values的存在是因为倒排索引只对某些操作是高效的。倒排索引的优势在于查找包含某个项的文档，而反过来确定哪些项在单个文档里并不高效。结构类似如下： Doc Term 阅读全文

posted @ 2018-08-20 23:16 小人物的奋斗阅读(4827) 评论(0) 推荐(0) 编辑

ES系列七、ES-倒排索引详解

摘要： 1.单词——文档矩阵单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型，图3-1展示了其含义。图3-1的每列代表一个文档，每行代表一个单词，打对勾的位置代表包含关系。图3-1 单词-文档矩阵从纵向即文档这个维度来看，每列代表文档包含了哪些单词，比如文档1包含了词汇1和词汇4，而不包含其阅读全文

posted @ 2018-08-20 22:21 小人物的奋斗阅读(17040) 评论(0) 推荐(0) 编辑

不积小流，无以成江海！

ES系列九、ES优化聚合查询之深度优先和广度优先

ES系列八、正排索Doc Values和Field Data

ES系列七、ES-倒排索引详解

导航

公告