摘要: 数据湖 数据湖的产生是为了存储各种各样原始数据的大型仓库。这些数据根据需求,进行存取、处理、分析等。对于存储部分来说,开源版本常见的就是 hdfs。而各大云厂商也提供了各自的存储服务,如 Amazon S3,Azure Blob 等。 而由于数据湖中存储的数据全部为原始数据,一般需要对数据做ETL( 阅读全文
posted @ 2020-04-13 00:34 ZacksTang 阅读(4008) 评论(0) 推荐(0) 编辑