Mr查

博客园 首页 新随笔 联系 订阅 管理

这一两年Spark技术很火,自己也凑热闹,反复的试验、研究,有痛苦万分也有欣喜若狂,抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍,从Spark的简介、编译、部署,再到编程模型、运行架构,最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理,随后是实战例子,由于面向的是入门读者,在实战中多截图,还请谅解。为了大家实验方便,在这里把实验相关的测试数据和安装包放在百度盘提供下载 地址为http://pan.baidu.com/s/1o7HpDEy 密码:9xjt。

本系列博客在博客园和CSDN首发,地址为:

博客园 http://www.cnblogs.com/shishanyuan

CSDN http://blog.csdn.net/yirenboy

以下为该系列文章列表:

1.Spark及其生态圈简介  下载

2.Spark编译与部署(上)--基础环境搭建  下载

2.Spark编译与部署(中)--Hadoop编译安装  下载

2.Spark编译与部署(下)--Spark编译安装  下载

3.Spark编程模型(上)--编程模型及SparkShell实战  下载

3.Spark编程模型(下)--IDEA搭建及实战  下载

4.Spark运行架构  下载

5.Hive(上)--Hive介绍及部署  下载

5.Hive(下)--Hive实战  下载

6.SparkSQL(上)--SparkSQL简介  下载

6.SparkSQL(中)--深入了解运行计划及调优  下载

6.SparkSQL(下)--Spark实战应用  下载

7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍  下载

7.Spark Streaming(下)--实时流计算Spark Streaming实战  下载 

8.Spark MLlib(上)--机器学习及SparkMLlib简介  下载 

8.Spark MLlib(下)--机器学习库SparkMLlib实战  下载

9.Spark图计算GraphX  下载

10.分布式内存文件系统Tachyon介绍及安装部署  下载

 

 

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。如果觉得还有帮助的话,可以点一下右下角的【推荐】,希望能够持续的为大家带来好的技术文章!想跟我一起进步么?那就【关注】我吧
posted on 2017-11-01 17:42  Mr查  阅读(1395)  评论(0编辑  收藏  举报