摘要: 设计思想:分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析; 在大数据系统中作用:为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务 重点概念:文件切块,副本存放,元数据 1. HDFS的概念和特性 首先, 阅读全文
posted @ 2018-08-10 16:04 邓不利多 阅读(457) 评论(0) 推荐(0) 编辑