会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大数据从业者
最新文章,见微信公众号:大数据从业者
博客园
首页
新随笔
联系
管理
订阅
2022年4月9日
Apache Hudi的索引类型及应用场景
摘要: Apache Hudi使用索引来定位更删操作所在的文件组。对于Copy-On-Write表,索引能加快更删的操作,因为避免了通过连接整个数据集来决定哪些文件需要重写。对于Merge-On-Read表,这个设计,对于任意给定的基文件,能限定要与其合并的记录数量。具体地,一个给定的基文件只需要和其所包含
阅读全文
posted @ 2022-04-09 10:05 大数据从业者FelixZh
阅读(1265)
评论(0)
推荐(0)
编辑
公告