上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 80 下一页
摘要: 按时间统计:date_histogram 注意,这种写法在数字字段没有问题,但是在文本字段使用之前必须先把对应字段的fielddata设为true才可以。否则会报错: 注意,设置了fielddata会消耗大量内存。 返回空buckets:设置参数 min_doc_count 限制返回时间范围:设置参 阅读全文
posted @ 2017-06-15 16:42 匡子语 阅读(463) 评论(0) 推荐(0) 编辑
摘要: 参考资料: https://elasticsearch.cn/book/elasticsearch_definitive_guide_2.x/_combining_the_two.html 特定概念: 桶(Buckets)满足特定条件的文档的集合 指标(Metrics)对桶内的文档进行统计计算 CO 阅读全文
posted @ 2017-06-14 18:55 匡子语 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 参考: http://www.cnblogs.com/kaituorensheng/p/3595879.html https://github.com/fxsjy/jieba 判断是否包含中文 提取中文 中文分词 使用模块jieba。安装pip install jieba Full Mode: 我 阅读全文
posted @ 2017-06-14 15:56 匡子语 阅读(1445) 评论(0) 推荐(0) 编辑
摘要: 本系列的笔记都来自:https://elasticsearch.cn/book/elasticsearch_definitive_guide_2.x/multi-field-search.html 下面的语句通过boost提高了title和author的权重。如果不加boost字段,则title,a 阅读全文
posted @ 2017-06-13 18:45 匡子语 阅读(1396) 评论(0) 推荐(0) 编辑
摘要: 刚开始接触es,由于弄不清楚match_phrase和regexp导致很多查询结果与预想的不同。在这整理一下。 regexp:针对的是单个词项 match_phrase:针对的是多个词项的相对位置 它们的查询结果跟分析器分词的方式有很大关系。 比如,我有两个字符串"HELLO-world" 和 "h 阅读全文
posted @ 2017-06-12 19:34 匡子语 阅读(3618) 评论(0) 推荐(0) 编辑
摘要: 全文搜索两个最重要的方面是:相关性, 分析。 一旦谈论相关性或分析这两个方面的问题时,我们所处的语境是关于查询的而不是过滤。 match:单个词查询 步骤:1.分析字段类型,是string。2.分析查询字符串,得到一个单词quick。3.用term查询,在倒排索引中查找quick。4.为文档评分。 阅读全文
posted @ 2017-06-12 18:37 匡子语 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 来源:http://blog.csdn.net/kevin6216/article/details/9021039 在多线程中用strptime需要加锁!!! 阅读全文
posted @ 2017-06-12 16:50 匡子语 阅读(646) 评论(0) 推荐(0) 编辑
摘要: 在控制台 splunk目录/bin下 启动时出错,需要更改一下SPLUNK的配置 $SPLUNK_HOME/etc/splunk-launch.conf: 阅读全文
posted @ 2017-06-09 20:23 匡子语 阅读(1995) 评论(0) 推荐(0) 编辑
摘要: 如果要插入一大批数据,千万不要一条一条的execute, commit。而应该是先全部execute,最后统一commit!!! 千万注意,时间差距还是很大的!! 正确示范:快 错误示范:慢 阅读全文
posted @ 2017-06-09 11:33 匡子语 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 仪表盘导出: splunk目录/etc/users/admin/search/local/data/ui/views 目录下,拷贝所有的xml文件 导入: 创建仪表盘->编辑来源 将上面导入的xml内容复制到文本框中,完成。 阅读全文
posted @ 2017-06-08 20:43 匡子语 阅读(779) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 80 下一页