Fork me on GitHub
摘要: HDFS 1. HDFS--写(上传) NameNode:Master主管管理者,管理HDFS的名称空间、配置副本策略、管理数据块Block的映射信息、处理客户端读写请求; DataNode:Slave,执行NN下达的命令,存储实际的数据块、执行数据块的读写操作; Client:①文件切分,将文件切 阅读全文
posted @ 2019-01-20 21:24 kris12 阅读(620) 评论(0) 推荐(0) 编辑
摘要: 概述 分布式运算程序 优点:易于编程;良好扩展性;高容错性;适合PB级以上海量数据的离线处理; 缺点:不擅长实时计算;不擅长流式计算;不擅长DAG有向图计算; 核心思想 1)分布式的运算程序往往需要分成至少2个阶段。 2)第一个阶段的MapTask并发实例,完全并行运行,互不相干。 3)第二个阶段的 阅读全文
posted @ 2019-01-20 21:24 kris12 阅读(265) 评论(0) 推荐(0) 编辑
levels of contents