摘要: 1、设计和实现了一种基于 Spark 的分布式 ETL 系统,包括利用 Spark 抽取、转换清洗和加载数据的具体过程。 2、设计和实现了基于 Spark 的物流企业数据仓库,包括物流企业数据仓库的分析主题、维度表和事实表确定以及数据仓库的维度模型、架构、构建过程和实现方法等内容。该数据仓库利用 H 阅读全文
posted @ 2020-03-09 09:09 小张在搬砖 阅读(875) 评论(0) 推荐(0) 编辑