摘要:
第13讲:Spark Standalone 模式的构建以及 Spark 与 Yarn 的整合 高俊峰(南非蚂蚁) ###安装部署独立模式的 Spark Spark 现在已经广泛使用在各个企业中,常见的应用模式有两种,分别是独立集群模式,以及与 Yarn 整合使用模式,下面分别介绍这两种模式的使用。 阅读全文
摘要:
第12讲:Hadoop 分布式资源管理器 Yarn、MR 运行机制剖析 高俊峰(南非蚂蚁) 本课时主要剖析 Hadoop 分布式资源管理器 Yarn 和 MR 运行机制。 ###Yarn 的整体架构 Yarn 是 Hadoop2.x 版本提出的一种全新的资源管理架构,此架构不仅支持 MapReduc 阅读全文
摘要:
第11讲:HDFS 组件运行机制剖析及 HDFS Shell 的使用 高俊峰(南非蚂蚁) ###HDFS 的基本架构 Hadoop 中的分布式文件系统 HDFS 为大数据平台提供了统一的存储,它主要由三部分构成,分别是 NameNode、DataNode 和 SecondaryNameNode。如果 阅读全文