2022 年 1月 17 日随笔档案 - chaplinthink

2022年1月17日

摘要：本文主要针对hudi进行调研, 设计MySQL CDC 近实时同步至数仓中方案, 写入主要利用hudi的upsert以及delete能力. 针对hudi 表的查询,引入kyuubi 框架,除了增强平台 spark sql 一些即席查询服务的能力外,同时支持查询hudi表,并可以实现hudi表与hive表的联合查询, 同时对原有hive相关服务没有太大影响. 阅读全文

posted @ 2022-01-17 22:27 chaplinthink 阅读(691) 评论(0) 推荐(1) 编辑

chaplinthink

关注领域: 大数据 & 架构设计