上一页 1 2 3 4 5 6 7 8 9 10 ··· 21 下一页
摘要: 一、MapReduce 慢的原因 MapReduce 程序效率的瓶颈在于两点: 1.1、计算机性能 CPU、内存、磁盘健康、网络 1.2、I/O 操作优化 (1)数据倾斜 (2)Map和Reduce数设置不合理 (3)Map运行时间太长,导致Reduce等待过久 (4)小文件过多 (5)大量的不可分 阅读全文
posted @ 2021-01-27 16:56 运维人在路上 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 一、Yarn基本架构 二、Yarn工作机制 三、作业提交全过程 3.1、作业提交过程之YARN 3.2、作业提交过程之MapReduce 四、资源调度器 4.1、先进先出调度器(FIFO) 4.2、容量调度器(Capacity Scheduler) 4.3、公平调度器(Fair Scheduler) 阅读全文
posted @ 2021-01-27 15:33 运维人在路上 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 一、数据压缩 1.1、概述 压缩技术能够有效减少底层存储系统(HDFS)读写字节数。压缩提高了网络带宽和磁盘空间的效率。在运行MR程序时,I/O操作、网络数据传输、 Shuffle和Merge要花大量的时间,尤其是数据规模很大和工作负载密集的情况下,因此,使用数据压缩显得非常重要。 鉴于磁盘I/O和 阅读全文
posted @ 2021-01-27 10:53 运维人在路上 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 一、OutputFormat数据输出 1.1、OutputFormat接口实现类 OutputFormat是MapReduce输出的基类,所有实现MapReduce输出都实现了 OutputFormat接口。下面我们介绍几种常见的OutputFormat实现类。 1)文本输出TextOutputFo 阅读全文
posted @ 2021-01-26 14:58 运维人在路上 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 一、InputFormat数据输入 1.1、切片与MapTask并行度决定机制 1)问题引出 1.2、Job提交流程源码和切片源码详解 1.2.1、Job提交流程源码详解 1.2.2、FileInputFormat切片源码解析(input.getSplits(job)) /** * Generate 阅读全文
posted @ 2021-01-22 11:43 运维人在路上 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 一、MapReduce概述 1.1、MapReduce定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。 阅读全文
posted @ 2021-01-20 19:49 运维人在路上 阅读(346) 评论(0) 推荐(0) 编辑
摘要: 一、NameNode和SecondaryNameNode 1.1、NN和2NN工作机制 1.2、Fsimage和Edits解析 1.2.1、Fsimage和Edits概念 NameNode被格式化之后,将在/opt/module/hadoop-2.7.2/data/tmp/dfs/name/curr 阅读全文
posted @ 2021-01-19 16:19 运维人在路上 阅读(790) 评论(0) 推荐(0) 编辑
摘要: 一、HDFS客户端环境准备 二、HDFS客户端API操作 2.1、HDFS文件上传(测试参数优先级) 2.2、HDFS文件下载 1)编写源代码 2.3、HDFS文件夹删除 2.4、HDFS文件名更改 2.5、HDFS文件详情查看 2.6、HDFS文件和文件夹判断 2.7、HDFS的I/O流操作 2. 阅读全文
posted @ 2021-01-18 17:18 运维人在路上 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 一、HDFS概述 1.1、HDFS产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 1.2、HDFS定义 HDFS(H 阅读全文
posted @ 2021-01-18 15:26 运维人在路上 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 一、前期准备 二、jar包安装 三、编译源码 阅读全文
posted @ 2021-01-18 14:55 运维人在路上 阅读(242) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 21 下一页