Hadoop 3.0.0-alpha1几个值得关注的特性

1、支持纠删码:意味着更灵活的存储策略,即经常使用的数据利用备份方式存储(3倍存储消耗),冷数据利用纠删码容错(1.4倍存储消耗,但会造成额外的IO及CPU消耗);

2、MapReduce任务支持本地map output collector:对于shuffle密集型的任务可以提升30%速度;

3、支持两个以上的NameNode:适用于容错性高的场景;

4、支持DataNode内部balancer:原来的balancer只能做到DataNode间的负载均衡,新加的balancer可以实现DataNode中各个磁盘间的均衡;

5、自动的堆内存管理:任务的堆内存大小不再依赖于固定配置,而是改为max和min区间自动调节,以达到更高的内存使用效率。

 

 参考: http://hadoop.apache.org/docs/current

posted @ 2016-10-24 18:11  牛肉哥  阅读(542)  评论(0编辑  收藏  举报