上一页 1 2 3 4 5 6 ··· 18 下一页
摘要: 参考https://www.cnblogs.com/fat-girl-spring/p/14282311.html https://www.jianshu.com/p/217144c71724 应用场景:比如一个维表索引每天都有一个分区 但实际上并不需要那么多 需要删除前七天的索引,这个时候就可以设 阅读全文
posted @ 2023-05-29 19:24 再见傅里叶 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 1、fileld_2字段存在与fileld_1字段不存在 GET index_1/_search{"track_total_hits": true, "query":{ "bool": { "must_not":[{ "exists": { "field": "fileld_1" } }], "mu 阅读全文
posted @ 2023-04-27 10:04 再见傅里叶 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 1、time.time() 返回当前时间的10位时间戳 2、random.randint(a,b) 返回a到b之间随机整数 3、datetime.now().strftime('%Y-%m-%d %H:%M:%S') 返回当前时间 并格式化到秒 阅读全文
posted @ 2022-12-16 18:55 再见傅里叶 阅读(15) 评论(0) 推荐(0) 编辑
摘要: term属于精确匹配,只能查单个词,tems可以匹配多个词(满足其中之一词的都会被搜索出来),多个词如果要同时匹配使用bool的must(must中带多个term); match进行搜索的时候,会先进行分词拆分,拆完后,再来匹配,match搜索多个单词满足其中之一词的都会被搜索出来(且不区分大小写) 阅读全文
posted @ 2022-12-12 09:43 再见傅里叶 阅读(564) 评论(0) 推荐(0) 编辑
摘要: es创建别名的好处: 1、不暴露索引名 2、可以为多个结构类似的索引(动态索引)创建相同的别名,查询的时候直接查询别名 ,然后自动匹配多个索引。 在不同的索引创建窗口。比如,如果为数据创建了每日索引,你可能期望一个滑动窗口覆盖过去一周的数据,别名就称为last-7-days.然后,每天创建新的每日索 阅读全文
posted @ 2022-12-09 15:51 再见傅里叶 阅读(116) 评论(0) 推荐(0) 编辑
摘要: sparksql的3种join实现 1、Broadcast Join (小表对大表) 在数据库的常见模型中(比如星型模型或者雪花模型),表一般分为两种:事实表和维度表。 维度表一般指固定的、变动较少的表,例如联系人、物品种类等,一般数据有限。 事实表一般记录流水,比如销售清单等,通常随着时间的增长不 阅读全文
posted @ 2022-12-09 10:07 再见傅里叶 阅读(820) 评论(0) 推荐(0) 编辑
摘要: 1、mysql建表主键,如果整数,用bigint而不用int 2、执行sql加最大执行时间 /*+ max_execution_time(60000)*/ 3、sql中避免offset过大,查询不出来 阅读全文
posted @ 2022-04-13 14:03 再见傅里叶 阅读(37) 评论(0) 推荐(0) 编辑
摘要: MemoryStateBackend(只用于本地开发和调试,不用于生产)和FsStateBackend(如果Flink作业的状态很小或需要很低的延迟,则应该考虑FsStateBackend),这两种都是基于JVM堆。 RocksDBStateBackend:非分布式数据库,它通过Java Nativ 阅读全文
posted @ 2022-03-29 15:59 再见傅里叶 阅读(377) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_29229567/article/details/106241831 阅读全文
posted @ 2022-03-17 14:29 再见傅里叶 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 把输入的文本块按照一定的策略进行分解,并建立倒排索引。在Lucene的架构中,这个过程由分析器(analyzer)完成。 主要组成 character filter:接收原字符流,通过添加、删除或者替换操作改变原字符流。例如:去除文本中的html标签,或者将罗马数字转换成阿拉伯数字等。一个字符过滤器 阅读全文
posted @ 2021-12-27 14:59 再见傅里叶 阅读(937) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 18 下一页