会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
zourui4271
博客园
首页
新随笔
联系
订阅
管理
公告
2022年1月18日
#
Hudi的更新机制
摘要: 在深入研究Hudi机制之前,让我们首先了解Hudi正在解决的问题。 客户在使用数据湖时通常会问一个问题:当源记录被更新时,如何更新数据湖?这是一个很难解决的问题,因为一旦你写了CSV或Parquet文件,唯一的选择就是重写它们,没有一种简单的机制可以打开这些文件,找到一条记录并用源代码中的最新值更新
阅读全文
posted @ 2022-01-18 13:50 zourui4271
阅读(964)
评论(0)
推荐(0)
编辑
Powered by:
博客园
Copyright © 2024 zourui4271
Powered by .NET 9.0 on Kubernetes