2017年9月20日

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

摘要: 本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来介绍 API, 然后展示如何使用 Java , Scala 和 Python 来编写应用程序。 为了继续阅读本指南, 首先从 Spark 官网 下载 Spark 的发行包。因为我们将不使用 HDFS, 所以你可以下载一个任何 Hadoop 版本的软件包。 阅读全文

posted @ 2017-09-20 14:22 nm-xy 阅读(641) 评论(0) 推荐(0) 编辑

Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

摘要: Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习的 MLlib, 用于图形处理的 GraphX, 以及 Spark Streaming。 阅读全文

posted @ 2017-09-20 14:19 nm-xy 阅读(411) 评论(0) 推荐(0) 编辑

导航