数据架构
索引(index):关系型数据库的表。每个索引有一个或多个分片(shard,每个分片都是一个独立的apache lucene索引),每个分片可以有多个副本(replica,是分片的精确复制,其中之一被自动关选择去更改索引操作,称之为住分片)
文档(document):表中的一行记录,由多个字段组成
唯一标识符和文档类型:两个不同类型的文档可以有相同的唯一标识符
字段(field):相同字段必须有相同类型,字段类型可以是文本、数值、日期等。字段类型也可以是复杂类型,一个字段包含其他自文档或者数组
文档类型:用于区分单个索引中的不同对象。同一个索引中的所有文档类型中,一个叫title的字段必须具有相同的类型
映射:为建索引和搜索准备输入文本
分析器由一个分词器(Tokenizer)和零个或多个token过滤器(TokenFilters)组成。分词器前有一个或多个char过滤器(CharFilters)。
分析模块允许注册 TokenFilters,
Tokenizers
和 Analyzers,在映射定义或者某一APIs中引用。
分析模块会自动注册(如果没有明确定义)内置 analyzers, token filters, and tokenizers。
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis.html
还看不懂链接中的例子