摘要: 很多刚初次接触MaxCompute的用户,面对繁多的产品文档内容以及社区文章,往往很难快速、全面了解MaxCompute产品全貌。同时,很多拥有大数据开发经验的开发者,也希望能够结合自身的背景知识,将MaxCompute产品能力与开源项目、商业软件之间建立某种关联和映射,以快速寻找或判断MaxCom 阅读全文
posted @ 2019-03-11 16:42 zhaowei121 阅读(369) 评论(0) 推荐(0) 编辑
摘要: DataWorks作为阿里云上广受欢迎的大数据开发调度服务,最近加入了对于Data Lake Analytics的支持,意味着所有Data Lake Analytics的客户可以获得任务开发、任务依赖关系管理、任务调度、任务运维等等全方位强大的能力,今天就给大家介绍一下如何使用DataWorks来调 阅读全文
posted @ 2019-03-11 16:26 zhaowei121 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 0. Data Lake Analytics(DLA)简介 关于Data Lake的概念,更多阅读可以参考:https://en.wikipedia.org/wiki/Data_lake 以及AWS和Azure关于Data Lake的解读:https://amazonaws-china.com/bi 阅读全文
posted @ 2019-03-11 16:16 zhaowei121 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 0. 概述 本文档面向需要使用MaxCompute Spark进行开发的用户使用。本指南主要适用于具备有Spark开发经验的开发人员。 MaxCompute Spark是MaxCompute提供的兼容开源的Spark计算服务,它在统一的计算资源和数据集权限体系之上,提供Spark计算框架,支持用户以 阅读全文
posted @ 2019-03-11 15:55 zhaowei121 阅读(974) 评论(0) 推荐(0) 编辑
摘要: 一、Data Lake Analytics介绍 数据湖(Data Lake)是时下大数据行业热门的概念:https://en.wikipedia.org/wiki/Data_lake。基于数据湖做分析,可以不用做任何ETL、数据搬迁等前置过程,实现跨各种异构数据源进行大数据关联分析,从而极大的节省成 阅读全文
posted @ 2019-03-11 15:28 zhaowei121 阅读(318) 评论(0) 推荐(0) 编辑