摘要: 一:hadoop为什么不适合处理大量的小文件,怎么解决? 原因: 1:文件的元数据(包括文件被分成了哪些blocks,每个block存储在哪些服务器的哪个block块上),都是存储在namenode上的内存,会对namenode的内存造成压力; 2: 文件过多会造成文件的定位时间(又称寻址时间)增大 阅读全文
posted @ 2018-10-30 18:36 上海小墨子 阅读(645) 评论(0) 推荐(0) 编辑