会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ccql
博客园
首页
新随笔
联系
订阅
管理
2023年1月27日
【Hadoop】MapReduce小文件问题解决方案(SequenceFile,MapFile)
摘要: Hadoop的HDFS和MapReduce都是针对大数据文件来设计的,在小文件的处理上不但效率低下,而且十分消耗内存资源。 在【Hadoop】HDFS高可用与高扩展原理分析(HA架构与Federation机制)这篇博客中有提到HDFS的小文件问题,集群启动时DataNode会向NameNode上报所
阅读全文
posted @ 2023-01-27 14:54 ccql
阅读(24)
评论(0)
推荐(0)
编辑
公告