摘要: 小文件问题处理 像hadoop这样的分布式集群是适合大数据文件处理的,为什么不适合小文件处理呢? 1.存储:hadoop的存储每个文件都会在NameNode上记录元数据,如果同样大小的文件,文件很小的话,就会产生很多文件,造成NameNode的压力; 2.读取:同样大小的文件分为很多小文件的话,会增 阅读全文
posted @ 2021-06-21 18:16 zzuCharles 阅读(230) 评论(0) 推荐(0) 编辑