2018年12月9日

Hadoop(11)-MapReduce概述和简单实操

摘要: 1.MapReduce的定义 2.MapReduce的优缺点 优点 缺点 3.MapReduce的核心思想 4.MapReduce进程 5.常用数据序列化类型 6.MapReduce的编程规范 用户编写的程序分成三个部分:Mapper、Reducer和Driver 7.WordCount简单操作 需 阅读全文

posted @ 2018-12-09 22:24 nt杨 阅读(251) 评论(0) 推荐(0) 编辑

Hadoop(10)-HDFS的DataNode详解

摘要: 1.DataNode工作机制 1)一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。 2)DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。 3)心跳 阅读全文

posted @ 2018-12-09 22:04 nt杨 阅读(327) 评论(0) 推荐(0) 编辑

Hadoop(9)-HDFS的NameNode和SecondaryNameNode详解

摘要: 1.NN和2NN工作机制 首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在内存中,一旦断电,元数据丢失,整个集群就无法工作了。因此产生在磁盘中备份元数据的FsImage。 这样又会带来新 阅读全文

posted @ 2018-12-09 21:54 nt杨 阅读(508) 评论(0) 推荐(0) 编辑

导航