摘要: 一、内置分词器 分词步骤 1). character filter:在一段文本进行分词之前,先进行预处理,eg:最常见的过滤html标签(hello -> hello), & -> and ( I & you -> I and you) 2). tokenizer:分词, eg:hello you 阅读全文
posted @ 2024-04-07 16:30 py卡卡 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 一.索引管理 直接put数据PUT index/_doc/1,ES会自动生成索引,并建立动态映射dynamic mapping 在生产上,需要自己手动建立索引和映射,为了更好地管理索引。就像数据库的建表语句一样 创建索引 PUT /index { "setting": {}, "mappings": 阅读全文
posted @ 2024-04-07 11:21 py卡卡 阅读(12) 评论(0) 推荐(0) 编辑