摘要: Nginx 概述 Nginx 是开源、高性能、高可靠的 Web 和反向代理服务器,而且支持热部署,几乎可以做到 7 * 24 小时不间断运行,即使运行几个月也不需要重新启动,还能在不间断服务的情况下对软件版本进行热更新。性能是 Nginx 最重要的考量,其占用内存少、并发能力强、能支持高达 5w 个 阅读全文
posted @ 2021-04-18 23:34 愿无违 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 在Flink UI上Cancel Job,不会停止所有的Job Cancel按钮只是把Source,Transform和Sink这些Operator停掉,对应的线程停掉。但整个TaskManager还在。 正确处理是在Operator的open()方法中初始化Spring容器,在close()方法中 阅读全文
posted @ 2021-04-18 23:02 愿无违 阅读(938) 评论(0) 推荐(0) 编辑
摘要: Async I/O的原理和基本用法 简单的来说,使用 Async I/O 对应到 Flink 的 API 就是 RichAsyncFunction 这个抽象类实现里面的3个方法 open(初始化) asyncInvoke(数据异步调用) close(停止的一些操作) 使用Async I/O的模板方法 阅读全文
posted @ 2021-04-18 22:19 愿无违 阅读(1157) 评论(0) 推荐(0) 编辑
摘要: 全量数据导入kudu时,这时候我们先用sqoop把关系数据库数据导入临时表,再用impala从临时表导入kudu目标表 由于sqoop从关系型数据直接以parquet格式导入hive会有问题,这里默认hive的表都是text格式; 每次导完到临时表,需要做invalidate metadata 表操 阅读全文
posted @ 2021-04-18 21:38 愿无违 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 1 配置内存 如果频繁出现Full GC,需要优化GC 在客户端的"conf/flink-conf.yaml"配置文件中,在“env.java.opts”配置项中添加参数: -Xloggc:<LOG_DIR>/gc.log -XX:+PrintGCDetails -XX:-OmitStackTrac 阅读全文
posted @ 2021-04-18 20:18 愿无违 阅读(2219) 评论(0) 推荐(0) 编辑