随笔分类 -  Elasticsearch

摘要:ES 分词器 自然语言处理 中文分词器 1. 中文分词是文本处理的基础步骤,也是人机交互时的基础模块. 2. 中文分词效果直接影响词性,句法等 3. 中文分词特点 - 基于 词典分词算法 - 基于 理解的分词方法 - 基于 统计的机器学习算法 词典分词算法 基于词典分词算法,也称为字符串匹配分词算法 阅读全文
posted @ 2023-02-12 00:47 染指未来 阅读(130) 评论(0) 推荐(0) 编辑
摘要:Es 建议器 浏览器的建议功能 es中 通过 _search 做建议器 PUT s1 { "mappings": { "doc": { "properties": { "title": { "type": "text", "analyzer": "standard" } } } } } PUT s1 阅读全文
posted @ 2023-02-12 00:39 染指未来 阅读(39) 评论(0) 推荐(0) 编辑
摘要:ES 番外篇 ES 批量写入 顺序写入 100条 # 写入 100条数据 import time from elasticsearch import Elasticsearch es = Elasticsearch() def timer(func): def wrapper(*args, **kw 阅读全文
posted @ 2021-05-23 11:29 染指未来 阅读(427) 评论(0) 推荐(0) 编辑
摘要:Es 总结 什么是分片? # put a1/doc/1 - a1 索引下 创建了5个主分片, 每一个主分片对应一个复制分片 es 如何处理分页? - from / size elsaticsearch 和 lucene 的区别 - lucene : 是搜索引擎库 - es 封装了lucene , 把 阅读全文
posted @ 2021-05-19 23:05 染指未来 阅读(176) 评论(0) 推荐(0) 编辑
摘要:ElasticSearch ES 之 增删改查 GET _search { "query": { "match_all": {} } } # 添加doc文本数据 PUT ttt/doc/1 { "name":"ttt" } # 获取数据 格式:数据库/类型/索引 GET ttt/doc/2 PUT 阅读全文
posted @ 2021-05-11 22:58 染指未来 阅读(96) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示