数据架构

索引（index）：关系型数据库的表。每个索引有一个或多个分片（shard，每个分片都是一个独立的apache lucene索引），每个分片可以有多个副本（replica，是分片的精确复制，其中之一被自动关选择去更改索引操作，称之为住分片）

文档（document）：表中的一行记录，由多个字段组成

唯一标识符和文档类型：两个不同类型的文档可以有相同的唯一标识符

字段（field）：相同字段必须有相同类型，字段类型可以是文本、数值、日期等。字段类型也可以是复杂类型，一个字段包含其他自文档或者数组

文档类型：用于区分单个索引中的不同对象。同一个索引中的所有文档类型中，一个叫title的字段必须具有相同的类型

映射：为建索引和搜索准备输入文本

分析器由一个分词器（Tokenizer）和零个或多个token过滤器（TokenFilters）组成。分词器前有一个或多个char过滤器（CharFilters）。

分析模块允许注册 TokenFilters，Tokenizers 和 Analyzers，在映射定义或者某一APIs中引用。

分析模块会自动注册（如果没有明确定义）内置 analyzers, token filters, and tokenizers。

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis.html

还看不懂链接中的例子

posted on 2016-01-14 09:22 天娱邪神阅读(219) 评论(0) 收藏举报