笔记:Hadoop权威指南 第1章 初识Hadoop

大数据处理遇到问题:

(1)、磁盘存储容量快速增加,但是访问速度进步不大;用户乐意使用磁盘共享访问。

(2)、硬件故障,可以使用备份解决。

(3)、分布式系统,需要可靠性。


关系数据库与MapReduce比较:

(1)、磁盘寻址时间提高远低于传输速率;流式读取取决于传输速率;在数据库更新大部分数据时候,B树的效率远低于MapReduce。

(2)、半结构化数据、非结构化数据,MapReduce更有效。



 

posted @ 2015-01-08 17:58  lihui1625  阅读(107)  评论(0编辑  收藏  举报