《Data-intensive Text Processing with MapReduce》读书笔记（入口）2011.7.23最后更新

本文是《Data-intensive Text Processing with MapReduce》一书（豆瓣链接）读书笔记博文列表。

这是我的第一个读书笔记，其中翻译与表述不当之处，望广大网友不吝赐教。

目前的状态：正在看书，边看边写，随着看书进度更新读书笔记。

虽然进度上没有绝对保证，但将读书笔记以博文的方式发布出来，是对自己的督促。

无论如何，我将认真研读并撰写报告。更新速度为3天左右一篇。

读完以后，将持续修订。并考虑添加一些实践练习。

书名中译（待定）：使用MapReduce进行密集文本数据处理

第1章：引言
http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-ch1.html

第2章：MapReduce基础

2.1 函数式编程
2.2 mapper与reducer

2.3 MapReduce执行框架
2.4 划分器（Partitioner）与合并器（Combiner）

2.5 分布式文件系统HDFS

2.6 Hadoop集群架构
2.7 总结

第3章：MapReduce算法基础（已完结）

引言
3.1 局部合并

3.2 对（pairs）与带（stripes）

3.3 计算相对频度（relative frequency，频率）

3.4 二次排序

3.5 关系连接
总结

因为最近工作比较忙，没有时间继续写这本书的读书笔记，所以本系列将会暂停一段时间。

posted on 2011-06-29 16:17 mdyang 阅读(4566) 评论(4) 编辑收藏举报

刷新页面返回顶部

Mengdong的技术博客