摘要:
前提条件: 1、Spark Standalone 集群部署完成 2、Intellij Idea 能够运行 Spark local 模式的程序。 源码: 这里主要的思想还是将打包的jar提交到集群。 使用.setJars方法 阅读全文
摘要:
RDD Resilient Distributed Datasets弹性分布式数据集 Spark revolves around the concept of a resilient distributed dataset (RDD), which is a fault-tolerant colle 阅读全文