摘要: 一头牛拉不动车的时候,我们用两头牛一起拉,而不是养一头更大的牛。——HadoopHadoop:作为关系数据库管理系统的一种补充,它以批处理的方式对数据集进行分析,适合于需要分析整个数据集的问题。背景:数据量巨大——需要大容量的数据库进行存储和处理。硬盘传输速率的增长慢于硬盘容量的增长——需要多个磁盘并行处理。硬盘寻址时间的增长慢于硬盘传输速率的增长——在数据库中加上更多磁盘来做大规模分析是不明智的。与传统的关系数据库相比:可以处理的数据大小为PB级。vs GB更适合一次大量更新后多次读入。vs 多次读写,持续更新如果要进行扩展,复杂度的增长是线性的。vs 非线性集成度低,逻辑较不复杂。vs集成 阅读全文
posted @ 2012-07-25 14:34 喵小雨 阅读(177) 评论(0) 推荐(0) 编辑