摘要: Chapter2.MapReduceMapReduce是一种数据处理的编程模式,模式很简单但很用。MapReduce可以用多种语言编程,Java,Ruby,Python。最重要的是,MapReduce程序是并行的,因此可以将大规模数据分析交给任何有足够机器的集群。 阅读全文
posted @ 2015-10-17 21:39 吓死宝宝 阅读(123) 评论(1) 推荐(0) 编辑
摘要: Chapter 1. Meet Hadoop(大部分略)Comparison with Other Systems说一下和其他系统的比较Relational Database Management Systems为什么我们不使用很多硬盘来进行大规模分析呢?为什么需要Hadoop?答案就是:这么多年,... 阅读全文
posted @ 2015-10-17 21:37 吓死宝宝 阅读(262) 评论(0) 推荐(0) 编辑