Fork me on GitHub

ES mapping映射及优化

mapping映射

主要类型:

 

  • 同一index下,不同type中如果有相同filed;es进行mapping映射的时候,按照先写进去的指定类型;比如同一index,包含的type中都有key1字段,如果第一次写进去的是long类型,后面所有type中key1字段都按照long类型格式化。

  • nested和array的区别
  • es中会把json数组平铺存储:"key":[{"a":1,"b":"abc"},{"a":2,"b":"xyz"}],es会把上面的数组存储为:"key":{"a":[1,2],"b":["abc","xyz"]};所以如果我想的到当a>1的时候获取b的值,是拿不到我们想要的结果的!

  • 如果想要获取到我们想要的结果,需要指定映射为“nested”类型 "key":{ "type":"nested", "property":{ "a":{"type":"long"} "b":{"type":"string"} } }
  • es默认不是这种格式,如果指定为nested类型,写入和查询的性能会受到影响!
  • 如果单个term最大长度超过32kb(32766)不可修改,写不进es

    • 可以针对比较大的内容做正则提取,作为单独字段存储
  • ignore_above:20(允许写入20个字节)

    • 超过这个值可以写进去es,但是无法搜索到(超过之后,写进es不会做索引)

什么是DocValues?为什么要用DocValues ?

Elasticsearch cluster中的内存多半都被消耗在了field data(也就是我们常说的正排索引)上,field data主要用于:

对索引操作的一些优化

http://itindex.net/detail/54945-elasticsearch2.0--索引-优化

ES中的分词器

https://my.oschina.net/xiaohui249/blog/260993

posted @ 2017-05-20 22:29  迁梦余光  阅读(4958)  评论(0编辑  收藏  举报