ErBing

往事已经定格,未来还要继续。

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
  77 随笔 :: 0 文章 :: 28 评论 :: 27万 阅读

随笔分类 -  Spark

摘要:一、概述 Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习 阅读全文
posted @ 2018-11-16 16:45 ErBing 阅读(648) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、 Spark运行架构 1.1 术语定义 lApplication:Spark Application的概念和Hadoop MapReduce中的类似,指的是用户编写的Spark应用程序,包含了一个Dr 阅读全文
posted @ 2017-12-06 15:19 ErBing 阅读(320) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、 安装IntelliJ IDEA IDEA 全称 IntelliJ IDEA,是java语言开发的集成环境,IntelliJ在业界被公认为最好的java开发工具之一,尤其在智能代码助手、代码自动提示、 阅读全文
posted @ 2017-12-06 15:17 ErBing 阅读(311) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、Spark编程模型 1.1 术语定义 l应用程序(Application): 基于Spark的用户程序,包含了一个Driver Program 和集群中多个的Executor; l驱动程序(Drive 阅读全文
posted @ 2017-12-06 14:50 ErBing 阅读(324) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、编译Spark Spark可以通过SBT和Maven两种方式进行编译,再通过make-distribution.sh脚本生成部署包。SBT编译需要安装git工具,而Maven安装则需要maven工具, 阅读全文
posted @ 2017-12-06 11:22 ErBing 阅读(2301) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、编译Hadooop 1.1 搭建环境 1.1.1 安装并设置maven 1. 下载maven安装包,建议安装3.0以上版本,本次安装选择的是maven3.0.5的二进制包,下载地址如下 http:// 阅读全文
posted @ 2017-12-06 11:19 ErBing 阅读(230) 评论(0) 推荐(0) 编辑

摘要:【注】 1、该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取; 2、Spark编译与部署将以CentOS 64位操作系统为基础,主要是考虑到实际应用一般使用64位操作系统,内容分为三部分:基础环境搭建、Hadoop编译安装和Spark编译安装,该环境作为后续实 阅读全文
posted @ 2017-12-06 10:32 ErBing 阅读(261) 评论(0) 推荐(0) 编辑

摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月 阅读全文
posted @ 2017-12-06 10:28 ErBing 阅读(493) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示