摘要: YARN设计理念与基本架构1,MRv1的局限性:扩展性差,可靠性差,资源利用率低,无法支持多种计算框架2,YARN基本设计思想1)基本框架对比 Hadoop1.0中,JobTracker由资源管理和作业控制两部分组成MRv1的局限性多,正是由于Hado... 阅读全文
posted @ 2017-06-12 14:20 zhou_jun 阅读(895) 评论(0) 推荐(0) 编辑
摘要: 1, hdfs设计:减少硬件错误的危害,流式数据访问,大规模数据集,简单的一致性模型2,特点:1)移动计算的代价比移动数据的代价低在异构的软硬件平台间的可移植性2)局限性不适合低延迟性数据访问。可使用Hbase解决。不能高效存储小文件。对NameNode压力大。不支持... 阅读全文
posted @ 2017-06-12 14:12 zhou_jun 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 1,为什么需要hadoop 数据分析者面临的问题 数据日趋庞大,读写都出现性能瓶颈; 用户的应用和分析结果,对实时性和响应时间要求越来越高; 使用的模型越来越复杂,计算量指数... 阅读全文
posted @ 2017-06-12 14:06 zhou_jun 阅读(532) 评论(0) 推荐(0) 编辑