摘要: Hadoop是一个可以通过相对简单编程模型实现跨多台计算机集群分布式处理大型数据集的框架。它不是依赖于高额成本的硬件可靠性来提供高可用性,Hadoop的设计能从单个服务器扩展到数千台机器,每个机器提供本地计算和存储。即使每个计算机都可能发生故障,但是hadoop本身具备检测和处理应用层的故障,因此在 阅读全文
posted @ 2018-05-10 23:56 萧哥 阅读(626) 评论(0) 推荐(0) 编辑