摘要: 一、安装Spark 《Spark2.4.0入门:Spark的安装和使用》 博客地址:http://dblab.xmu.edu.cn/blog/1307-2/ 1.1 基础环境 1.1.1 安装Spark之前需要安装: Linux系统 Java环境(Java8或JDK1.8以上版本) Hadoop环境 阅读全文
posted @ 2022-03-08 18:59 stu(dying) 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 一、列举Hadoop生态的各个组件及其功能、以及各个组件之间的相互关系,以图呈现并加以文字描述 1. HDFS(Hadoop分布式文件系统) Hadoop分布式文件系统是Hadoop项目的两大核心之一,是针对谷歌文件系统(GoogleFileSystem,GFS)的开源实现。 HDFS具有处理超大数 阅读全文
posted @ 2022-03-01 19:27 stu(dying) 阅读(172) 评论(0) 推荐(0) 编辑