《Data-intensive Text Processing with MapReduce》读书笔记(入口)2011.7.23最后更新
本文是《Data-intensive Text Processing with MapReduce》一书(豆瓣链接)读书笔记博文列表。
这是我的第一个读书笔记,其中翻译与表述不当之处,望广大网友不吝赐教。
目前的状态:正在看书,边看边写,随着看书进度更新读书笔记。
虽然进度上没有绝对保证,但将读书笔记以博文的方式发布出来,是对自己的督促。
无论如何,我将认真研读并撰写报告。更新速度为3天左右一篇。
读完以后,将持续修订。并考虑添加一些实践练习。
书名中译(待定):使用MapReduce进行密集文本数据处理
第2章:MapReduce基础
2.1 函数式编程
2.2 mapper与reducer
2.3 MapReduce执行框架
2.4 划分器(Partitioner)与合并器 (Combiner)
2.5 分布式文件系统HDFS
2.6 Hadoop集群架构
2.7 总结
第3章:MapReduce算法基础(已完结)
引言
3.1 局部合并
3.2 对(pairs)与带(stripes)
3.3 计算相对频度(relative frequency,频率)
3.4 二次排序
3.5 关系连接
总结
因为最近工作比较忙,没有时间继续写这本书的读书笔记,所以本系列将会暂停一段时间。