跟我学Elasticsearch(10) partial update的原理和使用

我们用document的全量替换来对比一下partial update。全量替换时，我们需要把document里的所有field给到es进行替换，而partial update只需要把document id和需要更新的部分字段给到es就行，两种方式对document的修改结果是一样的。

既然如此那为何还要用partial update呢？我画个图对比下

我们可以直观的看到全量替换document时，如果document过大，会占用更多网络带宽和磁盘io，因此整个查询更新的时间间隔会更长，产生并发冲突(留到下一篇讲)的几率也会更大。

事实上全量替换和partial update两种方式都需要先查询全量document后全量写入的，全量替换的方式是由我们程序查询后再写入，而partial update的方式全量查询和全量写入都是发生在es一个shard内部，避免了网络开销，也有效减少了并发冲突。

先写入一条测试数据

PUT /product/book/1
{
  "product_name": "yuwen shu",
  "num": 10
}

用全量替换的方式进行更新test_field2字段是这样的

PUT /product/book/1
{
  "product_name": "yuwen shu",
  "num": 11
}

而用partial update更新test_field2字段是这样的

POST /product/book/1/_update
{
  "doc": {
    "num": 12
  }
}

es有个内置的脚本支持，可以基于groovy脚本进行各种复杂操作，那么基于groovy脚本怎么进行partial update呢

POST /product/book/1/_update
{
   "script" : "ctx._source.num+=1"
}

此时num变成了12+1=13

posted @ 2020-07-31 22:20 百里喻初原阅读(343) 评论(0) 编辑收藏举报

刷新页面返回顶部

百里喻初原