摘要: 前面展示了 MapReduce 针对 小量 输入的 工作方式, 现在是时候 整体 了解 系统 并 进入 大数据 流 作为 输入了。 为简单起见,我们的例子 到目前为止 都使用 本地 文件系统 中的文件。 然而 , 为了 分布化,我们需要 把 数据 存储在 分布式文件 系统中, 典型的如 HDFS , 阅读全文
posted @ 2016-04-10 18:33 行者无疆Duffy 阅读(315) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-04-10 11:06 行者无疆Duffy 阅读(1) 评论(0) 推荐(0) 编辑