2015年2月27日

Hadoop MapReduce工作原理

摘要: 在学习Hadoop,慢慢的从使用到原理,逐层的深入吧 第一部分:MapReduce工作原理 MapReduce 角色 •Client :作业提交发起者。 •JobTracker: 初始化作业,分配作业,与TaskTracker通信,协调整个作业。 •TaskTracker:保持Jo... 阅读全文

posted @ 2015-02-27 17:13 哼哼唧唧 阅读(132) 评论(0) 推荐(0) 编辑

Hadoop与分布式数据处理 Spark VS Hadoop有哪些异同点?

摘要: Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴... 阅读全文

posted @ 2015-02-27 16:17 哼哼唧唧 阅读(198) 评论(0) 推荐(0) 编辑

导航