zourui4271

博客园 首页 新随笔 联系 订阅 管理

2022年1月18日 #

摘要: 在深入研究Hudi机制之前,让我们首先了解Hudi正在解决的问题。 客户在使用数据湖时通常会问一个问题:当源记录被更新时,如何更新数据湖?这是一个很难解决的问题,因为一旦你写了CSV或Parquet文件,唯一的选择就是重写它们,没有一种简单的机制可以打开这些文件,找到一条记录并用源代码中的最新值更新 阅读全文
posted @ 2022-01-18 13:50 zourui4271 阅读(964) 评论(0) 推荐(0) 编辑