ElasticSearch--Document

常见术语
文档 Document:用户存储到es中的数据文档。类比数据库中表中的一条数据,是es中的最小单元。
索引 Index:由具有相同字段的文档列表组成。类比数据库中的表。
Document
Document 由 json Object 组成。每个字段可以指定类型。每个Document还包含元数据。
字段类型Field type

字段类型概述
一级分类    二级分类    具体类型
核心类型    字符串类型    text,keyword
整数类型    integer,long,short,byte
浮点类型    double,float,half_float,scaled_float
逻辑类型    boolean
日期类型    date
范围类型    range
二进制类型    binary
复合类型    数组类型    array
对象类型    object
嵌套类型    nested
地理类型    地理坐标类型    geo_point
地理地图    geo_shape
特殊类型    IP类型    ip
范围类型    completion
令牌计数类型    token_count
附件类型    attachment
抽取类型    percolator

text类型:当一个字段是要被全文搜索的,比如Email内容、产品描述,应该使用text类型。设置text类型以后,字段内容会被分析,在生成倒排索引以前,字符串会被分析器分成一个一个词项。text类型的字段不用于排序,很少用于聚合(termsAggregation除外)。

keyword类型
keyword类型适用于索引结构化的字段,比如email地址、主机名、状态码和标签。如果字段需要进行过滤(比如查找已发布博客中status属性为published的文章)、排序、聚合。keyword类型的字段只能通过精确值搜索到。

数字类型
对于数字类型,ELasticsearch支持以下几种。

类型               取值范围
long               -263至263-1
integer            -231至231-1
short              -32,768至32768
byte               -128至127
double             64位双精度IEEE 754浮点类型
float              32位单精度IEEE 754浮点类型
half_float         16位半精度IEEE 754浮点类型
scaled_float       缩放类型的的浮点数(比如价格只需要精确到分,price为57.34的字段缩放因子为100,存起来就是5734)
参考博客:https://blog.csdn.net/hxyascx/article/details/98476957

posted @ 2021-07-15 17:31  郭慕荣  阅读(120)  评论(0编辑  收藏  举报