蓝天

上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 76 下一页

2023年5月10日 #

Hudi的Index类型

摘要: Hudi 的索引是 hoodiekey 到文件组(File Group)或者文件 ID(File ID)的映射,hoodiekey 由 recordkey 和 partitionpath 两部分组成。 定义在文件 HoodieIndex.java 中。 分一下几种: |类型|说明| |:-|:-| 阅读全文

posted @ 2023-05-10 11:16 #蓝天 阅读(102) 评论(0) 推荐(0) 编辑

Hudi的precombine.field释疑

摘要: 从不同资料,可看到四个让人迷惑的 precombine.field 配置项: precombine.field write.precombine.field hoodie.table.precombine.field hoodie.datasource.write.precombine.field 阅读全文

posted @ 2023-05-10 09:44 #蓝天 阅读(209) 评论(0) 推荐(0) 编辑

2023年5月9日 #

Flink创建Hudi的Sink动态表

摘要: 工厂类 HoodieTableFactory 提供的创建动态表接口 createDynamicTableSource 和 createDynamicTableSink,对应的源码文件为:https://github.com/apache/hudi/blob/master/hudi-flink-dat 阅读全文

posted @ 2023-05-09 16:40 #蓝天 阅读(191) 评论(0) 推荐(0) 编辑

Hudi的Flink配置项(1)

摘要: 名词 FallbackKeys 备选 keys,可理解为别名,当指定的 key 不存在是,则找备选 keys,在这里指配置项的名字。 相关源码 FlinkOptions // https://github.com/apache/hudi/blob/master/hudi-flink-datasour 阅读全文

posted @ 2023-05-09 15:43 #蓝天 阅读(107) 评论(0) 推荐(0) 编辑

2023年5月8日 #

Hudi学习笔记5 - Hudi配置分析(1)

摘要: Hudi 官方配置文档:https://hudi.apache.org/docs/configurations,从源码分析可以看到配置项 hoodie.payload.ordering.field 已经废弃,取而代之的是 hoodie.datasource.write.precombine.fiel 阅读全文

posted @ 2023-05-08 15:49 #蓝天 阅读(255) 评论(0) 推荐(0) 编辑

Hudi学习笔记4 - Hudi配置之Spark配置

摘要: Spark Datasource Configs 读配置 |配置项|是否必须|默认值|配置说明| |:-|:-|:-|:-| |as.of.instant|Y|N/A|0.9.0 版本新增,时间旅行查询从哪儿开始,有两种格式的值:yyyyMMddHHmmss 和 yyyy-MM-dd HH:mm:s 阅读全文

posted @ 2023-05-08 15:42 #蓝天 阅读(190) 评论(0) 推荐(0) 编辑

Hudi学习笔记2 - Hudi配置之FlinkSQL配置

摘要: Flink Sql Configs |配置项|是否必须|默认值|配置说明| |:-|:-|:-|:-| |path|Y|N/A|Hudi表的 base path,如果不存在会创建,否则应是一个已初始化成功的 hudi 表| |read.end-commit|Y|N/A|| |read.start-c 阅读全文

posted @ 2023-05-08 15:40 #蓝天 阅读(270) 评论(0) 推荐(0) 编辑

2023年5月6日 #

Hudi学习笔记2 - Hudi配置

摘要: https://hudi.apache.org/docs/configurations Hudi配置分类 Spark Datasource Configs Spark Datasource 的配置。 Flink Sql Configs Flink SQL source/sink connectors 阅读全文

posted @ 2023-05-06 17:03 #蓝天 阅读(103) 评论(2) 推荐(0) 编辑

Hudi学习笔记1

摘要: 使用注意 从 0.10.0 版本开始,primaryKey 为必须的,不再支持没有主键的表。 primaryKey、primaryKey 和 type 均大小写敏感。 对于 MOR 类型的表,preCombineField 为必须的。 当设置 primaryKey、primaryKey 或 type 阅读全文

posted @ 2023-05-06 12:42 #蓝天 阅读(403) 评论(1) 推荐(0) 编辑

2023年4月27日 #

upsert部分hudi表字段报错“Expected table’s schema”

摘要: 当 insert into 一个 hudi 表时,如果只指定了部分字段,则运行时报错“Expected table’s schema”: java.sql.SQLException: java.util.concurrent.ExecutionException: java.lang.Runtime 阅读全文

posted @ 2023-04-27 21:36 #蓝天 阅读(86) 评论(0) 推荐(0) 编辑

上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 76 下一页

导航