2017年9月3日
摘要: HDFS前言: 1) 设计思想 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析; 2)在大数据系统中作用: 为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务 3)重点概念:文件切块,副本存放,元数据 4 阅读全文
posted @ 2017-09-03 16:58 别先生 阅读(843) 评论(0) 推荐(0) 编辑