elasticsearch 的mapping根据不同的数据格式设定属性
申明:学习探讨笔记,非结果性定义。里面很多可能是错误的,参考价值不大
elasticsearch 的mapping
订单号 如:ATTS000928732 类型不分词。 index: not_analyzed
订单号是全部数据 如: 63745345637 这样的分词是可以的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 | PUT /Order_v5 { "settings" : { //设置10个分片,理解为类似数据库中的表分区中一个个分区的概念,不知道是否妥当 "number_of_shards" : 10 }, "mappings" : { "trades" : { "_id" : { "path" : "id" }, "properties" : { "id" : { "type" : "integer" , //id:自增数字 //要求:查询 "store" : true }, "name" : { //名称:佳洁士,强生婴儿沐浴露,100w Led节能灯,户外多功能折叠椅等 //要求:抓住关键字,如:佳洁士+牙膏 or 牙刷; 强生+沐浴露; led+节能+100W; 户外+折叠椅等 //结论: 如果分词,就意味着产品品牌名词可能被拆分,如 "佳洁士", 如果不分词就意味着对用户输入要求匹配度高。先默认分词,试试看看。 "type" : "string" }, "brand" : { //品牌: PG,P&G,宝洁集团,宝洁股份,联想集团,联想电脑等 "type" : "string" }, "orderNo" : { //订单号 :如ATTS000928732 "type" : "string" , "index" : "not_analyzed" }, "description" : { //描述: 2015款玫瑰香型强生婴儿沐浴露,550ml,包邮 //搜索: 要求高亮所以设置store:true. 关键词权重:沐浴露 -> {强生+沐浴露 or 玫瑰花 + 沐浴露 or 550ml + 沐浴露 or 沐浴露 + 包邮-> {2015年 + 玫瑰香...}} //设置:必须分词,而且要控制好 "type" : "string" , "sort" : true }, "date" : { "type" : "date" }, "city" : { "type" : "string" }, "qty" : { // index无效 "type" : "float" }, "price" : { //价格: float index无效 "type" : "float" } } } } } |
参考:
官网 Elasticsearch.org
http://donlianli.iteye.com/blog/1975727
http://mednoter.com/ElasticSearch.html
....... 不一一列出,佩服那些笔记做好的。
定,精,简,俭
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构