摘要:
目录 1 join概念回顾2 Hive join语法2.1 规则树2.2 语法丰富 3 join查询数据环境准备4 Hive i... 阅读全文
摘要:
目录 1 Flink VS Spark运行角色2 生态3 运行模型4 编程模型对比5 任务调度原理6 时间机制对比7 kafka ... 阅读全文
摘要:
目录 1 内存管理问题引入2 内存划分3 堆外内存4 序列化与反序列化5 操纵二进制数据6 总结-面试 1 内存管理问题引入 F... 阅读全文
摘要:
目录 1 History Server性能优化2 序列化3 复用对象4 数据倾斜 1 History Server性能优化 fl... 阅读全文
摘要:
目录 1 什么是 Metrics?1.1 Metrics介绍1.2 Metric Types 2 WebUI监控3 REST A... 阅读全文
摘要:
目录 1 介绍2 集成Hive的基本方式3 准备工作4 SQL CLI5 代码演示 1 介绍 https://ci.apache... 阅读全文
摘要:
目录 1 介绍1.1 场景描述1.2 Bucket和SubTask、PartFile 2 案例演示3 File Sink介绍3.... 阅读全文
摘要:
目录 1 介绍1.1 异步IO操作的需求1.2 使用Aysnc I/O的前提条件1.3 Async I/O API 2 案例演示... 阅读全文
摘要:
目录 1 流处理的数据处理语义1.1 At-most-once-最多一次1.2 At-least-once-至少一次1.3 Exa... 阅读全文
摘要:
目录 1 介绍2 Window Join3 Interval Join4 代码演示5 代码演示 1 介绍 https://ci.... 阅读全文