会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ZacksTang
博客园
首页
新随笔
联系
管理
订阅
2020年4月13日
使用AWS Glue进行 ETL 工作
摘要: 数据湖 数据湖的产生是为了存储各种各样原始数据的大型仓库。这些数据根据需求,进行存取、处理、分析等。对于存储部分来说,开源版本常见的就是 hdfs。而各大云厂商也提供了各自的存储服务,如 Amazon S3,Azure Blob 等。 而由于数据湖中存储的数据全部为原始数据,一般需要对数据做ETL(
阅读全文
posted @ 2020-04-13 00:34 ZacksTang
阅读(4008)
评论(0)
推荐(0)
编辑
公告