摘要: 课程链接:Hadoop大数据平台架构与实践--基础篇 1.MapReduce原理 分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce) 问题1:1000副扑克牌少哪一张牌(去掉大小王) 问题2:100GB的网站访问日志文件,找出访问次数最多的IP地址 2.MapRe 阅读全文
posted @ 2018-06-21 20:44 Johnny、 阅读(3616) 评论(0) 推荐(0) 编辑
摘要: 课程链接:Hadoop大数据平台架构与实践--基础篇 1.HDFS基本概念 HDFS设计架构 块(Block)文件被切分成块进行存储,默认大小为64MB,块是文件存储处理的逻辑单元(备份、查找) NameNode是管理节点,存放文件元数据 客户查询一个访问请求,那么会向上NameNode去查询元数据 阅读全文
posted @ 2018-06-21 16:40 Johnny、 阅读(251) 评论(0) 推荐(0) 编辑