摘要: Hadoop1.x 组成 由Common(公共模块辅助工具)、HDFS(分布式数据存储)、MapReduce(分布式计算+资源调度)组成 简介 其中HDFS由一个NN和多个DN组成,MapReduce有一个JobTracker和多个TaskTracker组成。 在Hadoop1.0中容易造成单点故障 阅读全文
posted @ 2022-03-04 21:34 jsqup 阅读(658) 评论(0) 推荐(0) 编辑
摘要: 1. 写数据读数据 写数据流程 读数据流程 2. 为什么HDFS不支持存储小文件? 原因 占用NameNode大量的内存和磁盘来存储文件目录和块信息 读取小文件的寻址时间大于读取小文件内容的时间 解决方案 从根源上解决小文件的产生,如从每小时抽取一次修改为每天抽取一次来积累数据量 合并。写一个MR任 阅读全文
posted @ 2022-03-04 19:47 jsqup 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 解释 单机结构 理解 一个系统业务量很小的时候所有的代码都放在一个项目中就好了,然后这个项目部署在一台服务器上就好了。整个项目所有的服务都由这台服务器提供。这就是单机结构 缺点 单机的处理能力是有限的,当你的业务增长到一定程度的时候,单机的硬件资源将无法满足你的业务需求,此时便出现了集群模式。 集群 阅读全文
posted @ 2022-03-04 15:08 jsqup 阅读(36) 评论(0) 推荐(0) 编辑