会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
哥不是小萝莉
博客园
首页
新随笔
联系
订阅
管理
2021年6月27日
Hive和Spark分区策略
摘要: 1.概述 离线数据处理生态系统包含许多关键任务,最大限度的提高数据管道基础设施的稳定性和效率是至关重要的。这边博客将分享Hive和Spark分区的各种策略,以最大限度的提高数据工程生态系统的稳定性和效率。 2.内容 大多数Spark Job可以通过三个阶段来表述,即读取输入数据、使用Spark处理、
阅读全文
posted @ 2021-06-27 17:18 哥不是小萝莉
阅读(1730)
评论(0)
推荐(1)
编辑
公告