摘要: Spark小课堂Week4 从控制台看Spark逻辑结构 层级关系: 从监控控制台,我们可以看到如下关系: 一个 Job 包含 n Stage 一个 Stage 包含 n Task Job0解决什么问题? 在控制台,有一个Job0,负责进行数据接收。 其实这个程序并没有分布式的需求,为什么要采用Jo 阅读全文
posted @ 2016-07-24 14:36 哎哟慰 阅读(350) 评论(0) 推荐(0) 编辑
摘要: Spark小课堂Week3 FirstSparkApp(代码优化) RDD代码简化 对于昨天练习的代码,我们可以从几个方面来简化: 1. 使用fluent风格写法,可以减少对于中间变量的定义。 2. 使用lambda表示式来替换对象写法,可以使用到类型推断功能,减少对于类型的定义。 优化后代码如下: 阅读全文
posted @ 2016-07-24 14:17 哎哟慰 阅读(270) 评论(0) 推荐(0) 编辑
摘要: Spark小课堂Week3 FirstSparkApp 问题:Java有哪些数据结构 大致有如下几种,其中List与Map是最重要的: List Map Set Array Heap Stack Queue Tree 练习:构造一个1 5的List,把他们打印出来 写法1 几点说明: 1. iter 阅读全文
posted @ 2016-07-24 14:14 哎哟慰 阅读(294) 评论(0) 推荐(0) 编辑
摘要: Catalyst揭秘 Day5 optimizer解析 Optimizer是目前为止中catalyst中最重要的部分。主要作用是把analyzed logicalPlan变成optimized LogicalPlan。optimizer和analyzer都继承自RuleExecutor。所以表现形式 阅读全文
posted @ 2016-07-24 14:13 哎哟慰 阅读(399) 评论(0) 推荐(1) 编辑
摘要: Spark小课堂Week2 Hello Streaming 我们是怎么进行数据处理的? 批量方式处理 目前最常采用的是批量方式处理,指非工作时间运行,定时或者事件触发。这种方式的好处是逻辑简单,不影响联机业务,但是性能不行。 理想方式 对于数据处理的问题,我们的最终理想解,应该是满足业务规则正确的情 阅读全文
posted @ 2016-07-24 08:28 哎哟慰 阅读(241) 评论(0) 推荐(0) 编辑
摘要: Spark小课堂Week1 Hello Spark 看到Spark这个词,你的第一印象是什么? 这是一朵"火花",官方的定义是Spark是一个高速的、通用的、分布式计算系统!!! 用途:进行大数据计算,这里要注意,大数据是一个相对概念,并没有绝对的量化指标,一般我们认为在业务特定场景要求下,一台机器 阅读全文
posted @ 2016-07-24 07:54 哎哟慰 阅读(264) 评论(0) 推荐(0) 编辑
摘要: Catalyst揭秘 Day4 analyzer解析 今天继续解析catalyst,主要讲一下analyzer,在sql语句的处理流程中,analyzer是在sqlparse的基础上,把unresolved logical plan生成logcal plan。 Analyzer定义 在analyze 阅读全文
posted @ 2016-07-23 19:59 哎哟慰 阅读(373) 评论(0) 推荐(0) 编辑
摘要: Catalyst揭秘 Day3 sqlParser解析 今天我们会进入catalyst引擎的第一个模块sqlparser,它是catalyst的前置模块。 树形结构 从昨天的介绍我们可以看到sqlParser会返回一个logicalPlan,它是TreeNode的子类。 TreeNode,作为一个树 阅读全文
posted @ 2016-07-23 13:02 哎哟慰 阅读(901) 评论(0) 推荐(0) 编辑
摘要: Catalyst揭秘 Day2 Catalyst源码初探 这节课从源码角度来讲catalyst。 首先有一个观点要澄清,就是技术不是越底层就越是性能和效率更高。因为除了指令执行性能以外,更重要的是架构层次,里面的核心是数据和代码的本地性问题。如果是能在内存中或者多线程运行,很多时候Java会比C语言 阅读全文
posted @ 2016-07-22 19:46 哎哟慰 阅读(374) 评论(0) 推荐(1) 编辑
摘要: Catalyst揭秘 Day1 Catalyst本地解析 今天开始讲下Catalyst,这是我们必须精通的内容之一: 1. 在Spark2.x中,主要会以Dataframe和DataSet为api,无论是Dataframe和DataSet,底层都依赖Catalyst和Tungsten。 2. 根据官 阅读全文
posted @ 2016-07-19 23:03 哎哟慰 阅读(452) 评论(0) 推荐(0) 编辑