09 2018 档案
摘要:[TOC] 基本知识 查询结果返回设置:版本值、得分限制、定制返回字段 定制字段的返回,从性能角度考虑,不如直接返回_source 搜索类型 通过search_type设置,请求类型是: 1. query_then_fetch:默认设置。第一步在所有分片上执行查询得到对文档进行排序和分级所需信息,然
阅读全文
摘要:绪论 信息论解答了通信理论中的两个基本问题:临界数据压缩(答案:熵H)和临界通信传输速率的值(答案:信道容量C) 熵 如果随机变量X的概率密度函数为p(x),那么X的熵定义为 H(X)=- \sum p(x)log_2 p(x) 使用以2为底的对数函数,熵的量纲为比特。熵可以看作是随机变量的
阅读全文
摘要:统计决策的基本概念 决策这一概念属于现代管理学的范畴,它是管理的核心问题。在决策过程中,采用统计方法,利用有关的统计信息和相应的统计分析方法在不确定情况下进行决策,就是统计决策。 广义统计决策:确定型决策,风险型决策和非确定型决策 狭义统计决策:风险型决策和非确定型决策 损益矩阵表 |状态 概率|s
阅读全文
摘要:回归分析 相关分析是分析变量间的相关程度,具有相关关系的变量可以通过建立模型来分析它们之间的相互关系,这个过程称为回归分析。 相关程度:完全相关、不完全相关和不相关。完全相关的关系可以找到一个函数表达。 相关方向:正相关和负相关 相关形式:线性相关和非线性相关 回归分析 回归分析是通过建立回归模型来
阅读全文
摘要:索引 分片和副本 一个索引由多个分片组成,每个分片包含文档集的一部分。副本主要是为了增强容错性,提高吞吐量。 副本的数量可以随时的调整,但是分片的数量设定好后,不能修改 映射配置 类型确定机制 数字类型和日期类型可以通过设置自动检测,这一般是默认开启的。 dynamics_data_formats:
阅读全文