数据架构

索引(index):关系型数据库的表。每个索引有一个或多个分片(shard,每个分片都是一个独立的apache lucene索引),每个分片可以有多个副本(replica,是分片的精确复制,其中之一被自动关选择去更改索引操作,称之为住分片)

文档(document):表中的一行记录,由多个字段组成

唯一标识符和文档类型:两个不同类型的文档可以有相同的唯一标识符

字段(field):相同字段必须有相同类型,字段类型可以是文本、数值、日期等。字段类型也可以是复杂类型,一个字段包含其他自文档或者数组

文档类型:用于区分单个索引中的不同对象。同一个索引中的所有文档类型中,一个叫title的字段必须具有相同的类型

映射:为建索引和搜索准备输入文本

 

分析器由一个分词器(Tokenizer)和零个或多个token过滤器(TokenFilters)组成。分词器前有一个或多个char过滤器(CharFilters)。

分析模块允许注册 TokenFilters,Tokenizers 和 Analyzers,在映射定义或者某一APIs中引用。

分析模块会自动注册(如果没有明确定义)内置 analyzers, token filters, and tokenizers。

 

 

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis.html

还看不懂链接中的例子

posted on 2016-01-14 09:22  天娱邪神  阅读(217)  评论(0编辑  收藏  举报