摘要: 原文链接:离线数仓建设,企业大数据的业务驱动与技术实现丨03期直播回顾 视频回顾:点击这里 课件获取:点击这里 一、离线数仓建设背景 离线数据是相对实时数据而言的数据产出,不同于实时数据,离线数据一般是T+1天处理,也就是说昨天产生的数据至少要今天才能看到计算结果。离线数据一般应用于对数据时效要求不 阅读全文
posted @ 2022-06-10 13:55 袋鼠云数栈 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 原文链接:袋鼠云数栈基于CBO在Spark SQL优化上的探索 一、Spark SQL CBO选型背景 Spark SQL的优化器有两种优化方式:一种是基于规则的优化方式(Rule-Based Optimizer,简称为RBO);另一种是基于代价的优化方式(Cost-Based Optimizer, 阅读全文
posted @ 2022-06-10 11:18 袋鼠云数栈 阅读(323) 评论(0) 推荐(0) 编辑