摘要: Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。 “90%的世界数据在过去的几年中产生”。 由于新技术,设备和类似的社交网站通信装置的出现,人类产生的数据量每年都在迅速增长 阅读全文