为什么我们需要hadoop……
数据量持续增长
分析能力不够
大量的重复工作
无法分析长时间的数据
缺乏对数据分析的工具
服务器负载不均衡
高可用
•轻松处理100G数据量,大量的中间件pig/hive减少分析人员自行编写脚本的数据
方便扩展
•热插拔节点对集群的存储和计算无影响
易于维护
•有着上千台节点的成功应用案例,经历了严格的考验,丰富的集群管理工具,多点数据备份机制,计算容错功能。
数据量持续增长
分析能力不够
大量的重复工作
无法分析长时间的数据
缺乏对数据分析的工具
服务器负载不均衡
高可用