摘要: 这一节我们将介绍使用 "DeltaStreamer" 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用 "Hudi数据源" 的upserts加快大型Spark作业的方法。 对于此类数据集,我们可以使用各种查询引擎 "查询" 它们。 写操作 在此之前,了解Hudi数据源及delta 阅读全文
posted @ 2019-12-16 20:13 AnalyticDBMySQLSpark 阅读(3710) 评论(0) 推荐(1) 编辑