09 2021 档案
摘要:目录 1 数据同步问题1.1 数据同步的场景1.2 数据同步的问题 2 拉链表的设计2.1 功能与应用场景2.2 实现过程 3...
阅读全文
摘要:目录 1 连续登陆用户1.1 需求1.2 分析1.3 建表1.4 方案一:自连接过滤实现1.5 方案二:窗口函数实现 2 级联累...
阅读全文
摘要:目录 1 应用场景2 处理方式3 JSON函数:get_json_object3.1 功能3.2 语法3.3 使用 4 JSON...
阅读全文
摘要:目录 1 工作应用场景2 行转列:多行转多列2.1 需求2.3 实现 3 行转列:多行转单列3.1 需求3.2 concat3....
阅读全文
摘要:目录 1 实际工作需求2 URL的基本组成3 Hive中的URL解析函数3.1 数据准备3.2 需求3.3 parse_url3....
阅读全文
摘要:目录 1 应用场景1.1 Hive中的分隔符1.2 特殊数据2.2 需求 3 解决方案一:替换分隔符3.1 方案概述3.2 程序...
阅读全文
摘要:目录 1 UDTF之explode函数1.1 explode语法功能1.2 explode函数的使用1.3 案例:NBA总冠军球队...
阅读全文
摘要:目录 1 函数概述2 函数分类2.1 内置函数分类2.1.1 String Functions 字符串函数2.1.2 Date F...
阅读全文
摘要:目录 1 Hive内置运算符2 关系运算符3 算术运算符4 逻辑运算符 1 Hive内置运算符 随着Hive版本的不断发展,在H...
阅读全文
摘要:目录 1 CLIs and Commands客户端和命令1.1 Hive CLI1.1.1 Batch Mode 批处理模式1.1...
阅读全文
摘要:目录 1 join概念回顾2 Hive join语法2.1 规则树2.2 语法丰富 3 join查询数据环境准备4 Hive i...
阅读全文
摘要:目录 1 Flink VS Spark运行角色2 生态3 运行模型4 编程模型对比5 任务调度原理6 时间机制对比7 kafka ...
阅读全文
摘要:目录 1 内存管理问题引入2 内存划分3 堆外内存4 序列化与反序列化5 操纵二进制数据6 总结-面试 1 内存管理问题引入 F...
阅读全文
摘要:目录 1 History Server性能优化2 序列化3 复用对象4 数据倾斜 1 History Server性能优化 fl...
阅读全文
摘要:目录 1 什么是 Metrics?1.1 Metrics介绍1.2 Metric Types 2 WebUI监控3 REST A...
阅读全文
摘要:目录 1 介绍2 集成Hive的基本方式3 准备工作4 SQL CLI5 代码演示 1 介绍 https://ci.apache...
阅读全文
摘要:目录 1 介绍1.1 场景描述1.2 Bucket和SubTask、PartFile 2 案例演示3 File Sink介绍3....
阅读全文
摘要:目录 1 介绍1.1 异步IO操作的需求1.2 使用Aysnc I/O的前提条件1.3 Async I/O API 2 案例演示...
阅读全文
摘要:目录 1 流处理的数据处理语义1.1 At-most-once-最多一次1.2 At-least-once-至少一次1.3 Exa...
阅读全文
摘要:目录 1 介绍2 Window Join3 Interval Join4 代码演示5 代码演示 1 介绍 https://ci....
阅读全文
摘要:目录 1 BroadcastState介绍2 需求-实现配置动态更新3 编码步骤4 代码实现 1 BroadcastState介...
阅读全文
摘要:目录 1. 环境信息2. 安装mysql数据库3. 配置主从同步4. 配置从服务器登录主服务器的账号授权5. 从服务器的配置(my...
阅读全文
摘要:目录 1 需求2 数据3 编码步骤4 代码实现5 效果 1 需求 在电商领域会有这么一个场景,如果用户买了商品,在订单完成之后...
阅读全文
摘要:目录 1 需求2 数据3 编码步骤:4 代码实现5 效果 1 需求 Flink模拟双十一实时大屏统计 在大数据的实时处理中,实...
阅读全文
摘要:目录 1 Checkpoint1.1 State Vs Checkpoint1.2 Checkpoint执行流程1.2.1 简单流...
阅读全文
摘要:目录 1 Flink中的有状态计算2 无状态计算和有状态计算2.1 无状态计算2.2 有状态计算3 有状态计算的场景 4 状态的...
阅读全文
摘要:目录 1 Time分类2 EventTime的重要性2.1 示例12.2 示例22.3 示例32.4 示例42.5 总结 3 W...
阅读全文
摘要:目录 1. Flink四大基石2. Flink-Window操作2.1 为什么需要Window2.2 Window的分类2.2.1...
阅读全文
摘要:目录 1 官网API列表2 基本操作-略2.1 map2.2 flatMap2.3 keyBy2.4 filter2.5 sum2...
阅读全文
摘要:目录 1 预定义Sink1.1 基于控制台和文件的Sink 2 自定义Sink2.1 MySQL 3. Connectors3...
阅读全文
摘要:目录 1 预定义Source1.1 基于集合的Source1.2 基于文件的Source1.3 基于Socket的Source ...
阅读全文
摘要:目录 1 连续处理概述2 编程实现3 支持查询 1 连续处理概述 连续处理(Continuous Processing)是Spa...
阅读全文
摘要:目录 1 设备监控数据1.1 创建 Topic1.2 模拟数据 2 基于DataFrame分析3 基于SQL分析4 时间概念5 ...
阅读全文
摘要:目录 1 Kafka 数据消费2 Kafka 数据源3 Kafka 接收器3.1 配置说明3.2 实时数据ETL架构3.3 模拟基...
阅读全文
摘要:目录 1 重构代码2 Checkpoint 恢复3 MySQL 存储偏移量3.1 编写工具类3.2 加载和保存偏移量 1 重构...
阅读全文
摘要:目录 1 业务场景2 初始化环境2.1 创建 Topic2.2 模拟日志数据2.3 StreamingContextUtils 工...
阅读全文