spark入门 - Mr查

spark入门

这一两年Spark技术很火，自己也凑热闹，反复的试验、研究，有痛苦万分也有欣喜若狂，抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍，从Spark的简介、编译、部署，再到编程模型、运行架构，最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理，随后是实战例子，由于面向的是入门读者，在实战中多截图，还请谅解。为了大家实验方便，在这里把实验相关的测试数据和安装包放在百度盘提供下载地址为http://pan.baidu.com/s/1o7HpDEy 密码:9xjt。

本系列博客在博客园和CSDN首发，地址为：

博客园 http://www.cnblogs.com/shishanyuan

CSDN http://blog.csdn.net/yirenboy

以下为该系列文章列表：

1.Spark及其生态圈简介下载

2.Spark编译与部署（上）--基础环境搭建下载

2.Spark编译与部署（中）--Hadoop编译安装下载

2.Spark编译与部署（下）--Spark编译安装下载

3.Spark编程模型（上）--编程模型及SparkShell实战下载

3.Spark编程模型（下）--IDEA搭建及实战下载

4.Spark运行架构下载

5.Hive（上）--Hive介绍及部署下载