摘要: 一、应用执行机制一个应用的生命周期即,用户提交自定义的作业之后,Spark框架进行处理的一系列过程。在这个过程中,不同的时间段里,应用会被拆分为不同的形态来执行。1、应用执行过程中的基本组件和形态Driver: 运行在客户端或者集群中,执行Application的main方法并创建... 阅读全文
posted @ 2015-05-14 23:38 蒋源德 阅读(3350) 评论(1) 推荐(0) 编辑
摘要: 首先介绍一下Shark的概念 Shark简单的说就是Spark上的Hive,其底层依赖于Hive引擎的 但是在Spark平台上,Shark的解析速度是Hive的几多倍 它就是Hive在Spark上的体现,并且是升级版,一个强大的数据仓库,并且是兼容Hive语法的下面给出一张来自网上... 阅读全文
posted @ 2015-05-14 21:46 蒋源德 阅读(753) 评论(0) 推荐(0) 编辑