摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、RDDRDD(Resilient Distributed Dataset)叫做弹性分布 阅读全文
posted @ 2019-04-01 16:44 cac2020 阅读(795) 评论(0) 推荐(0) 编辑
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、什么是SparkApache Spark 是专为大规模数据处理而设计的快速通用的计算引 阅读全文
posted @ 2019-04-01 08:46 cac2020 阅读(424) 评论(0) 推荐(0) 编辑