随笔分类 -  Hadoop

摘要:MapReduce概述 MapReduce定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。 MapRe 阅读全文
posted @ 2021-08-27 22:25 Darling&GLL 阅读(169) 评论(0) 推荐(0)
摘要:HDFS概述 HDFS组成架构 1)NameNode(nn):就是Master,它是一个主管,管理者 管理HDFS的名称空间 配置副本策略 管理块的映射信息 处理客户端的读写请求 2)DataNode:就是实际存储数据,听从NameNode的命令,执行操作 存储实际的数据块 执行数据块的读写操作 S 阅读全文
posted @ 2021-08-20 18:28 Darling&GLL 阅读(253) 评论(0) 推荐(0)
摘要:HADOOP了解 Hadoop优势 Hadoop组成 HDFS架构组成 Hadoop Distributed File System 简称为HDFS,是一个分布式文件系统 HDFS架构概述 YARN架构组成 MapReduce将计算过程分为两个阶段:Map和Reduce 1)Map阶段并行处理输入数 阅读全文
posted @ 2021-08-18 15:39 Darling&GLL 阅读(106) 评论(0) 推荐(0)
摘要:MapReduce是一个分布式运算程序的编程框架,核心是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并运行在一个Hadoop集群上,高容错,适合PB级以上的海量数据的离线处理。 MapReduce概述 MapReduce核心思想 )分布式的运算程序往往需要分成至少2个阶段。 阅读全文
posted @ 2020-02-17 17:03 Darling&GLL 阅读(211) 评论(0) 推荐(0)
摘要:HDFS(Hadoop Distributed File System) 分布式文件系统,HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.由NameNode,若干DataNode,以及Secondary NameNode组成。 阅读全文
posted @ 2020-02-17 12:05 Darling&GLL 阅读(804) 评论(0) 推荐(0)
摘要:Hadoop是一个由Apache基金会所开发的分布式基础架构,Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算,特点是:高可靠性,高扩展性,高效性,高容错性。 Hadoop与Google三篇论文 Googl 阅读全文
posted @ 2020-02-17 11:39 Darling&GLL 阅读(3939) 评论(0) 推荐(4)