Mengdong的技术博客

学习,记录,分享

导航

2011年7月5日 #

《Data-intensive Text Processing with MapReduce》读书笔记第2章:MapReduce基础(3)

摘要: 本读书笔记的目录地址:http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html2.5 分布式文件系统HDFS从数据放置的角度看传统大规模数据处理中的问题前面集中关注处理。但没有数据,处理无从谈起。在传统集群架构(例如HPC)中,计算与存储是两个分离的组件。虽然不同系统的具体实现有差异,但总体思路是一致的:计算节点从存储节点将数据读入,处理数据,将结果写出。随着数据量的增大,数据处理对于计算能力的要求也在提高。随着计算能力的提高,存储节点与 阅读全文

posted @ 2011-07-05 09:59 mdyang 阅读(1239) 评论(0) 推荐(0) 编辑