摘要: 序言欢迎来到第一个使用Akka和Scala的指南。我们假设你已经知道Akka和Scala是什么,现在需要了解开始第一个项目的步骤。本指南有两种方式:创建一个独立项目,从命令行运行创建SBT项目,在SBT中运行因为... 阅读全文
posted @ 2017-04-20 00:20 柚子=_= 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 应用层80/20原则:80%的代码是 纯函数,其余如处理IO,数据库,用户交互等方面的20%的代码也应该尽量轻量级培养面向表达式的编程思维,培养函数式编程思维用Actor模型实现并发功能将更多的 行为 从 类里 ... 阅读全文
posted @ 2017-04-20 00:06 柚子=_= 阅读(215) 评论(0) 推荐(0) 编辑
摘要: Akka基础参照: http://www.importnew.com/16479.html Akka笔记之Actor简介 Akka中的Actor遵循Actor模型。你可以把Actor当作是人。这些人不会亲自... 阅读全文
posted @ 2017-04-19 23:56 柚子=_= 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 一.下载nmon。 根据CPU的类型选择下载相应的版本:http://nmon.sourceforge.net/pmwiki.php?n=Site.Downloadwget http://sourceforg... 阅读全文
posted @ 2017-03-30 14:40 柚子=_= 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 下面是常用的shell变量:$0 Shell本身的文件名$1~$n 添加到Shell的各参数值。$1是第1参数、$2是第2参数…$$ Shell本身的PID(ProcessID)$! Shell最后运行的后台Pr... 阅读全文
posted @ 2017-03-29 12:48 柚子=_= 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 概览Spark SQL用于处理结构化数据,与Spark RDD API不同,它提供更多关于数据结构信息和计算任务运行信息的接口,Spark SQL内部使用这些额外的信息完成特殊优化。可以通过SQL、DataFra... 阅读全文
posted @ 2017-03-23 13:00 柚子=_= 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 一. Spark基础知识 1.Spark是什么?UCBerkeley AMPlab所开源的类HadoopMapReduce的通用的并行计算框架dfsSpark基于mapreduce算法实现的分布式计算,拥有Had... 阅读全文
posted @ 2017-03-23 11:51 柚子=_= 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 一般来说任意一个sql子系统都需要有parser,optimizer,execution三大功能模块,在spark中这些又都是如何实现的呢,这些实现又有哪些亮点和问题?带着这些疑问,本文准备做一些比较深入的分析。... 阅读全文
posted @ 2017-03-23 11:48 柚子=_= 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 一. 整体架构总结为如下图: Dataframe本质是 数据 + 数据的描述信息(结构元信息)所有的上述SQL及dataframe操作最终都通过Catalyst翻译成spark程序RDD操作代码 spark... 阅读全文
posted @ 2017-03-23 11:28 柚子=_= 阅读(829) 评论(0) 推荐(0) 编辑
摘要: 一. spark-sql1.in 不支持子查询 eg. select * from src where key in(select key from test);支持查询个数 eg. select * from ... 阅读全文
posted @ 2017-03-23 11:23 柚子=_= 阅读(5735) 评论(0) 推荐(0) 编辑