《Hadoop开发者》第二期
目录
1、Hadoop 业界资讯......................................... - 1 -
2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究 ....... - 5 -
3、支持自定义爬虫的Nutch segment 文件存储接口改写.......... - 11 -
4、Nutch 中mapreduce 应用的几个特殊点 .................... - 14 -
5、Java RMI + Lucene 构建分布式检索应用初探 .............. - 17 -
6、一对多的表关联在mapreduce中的应用(续) ................. - 26 -
7、InputSplit 文件格式分析................................. - 32 -
8、短评:HDFS、MapReduce和HBase 三者相辅相成、各有长处 .... - 34 -
9、HDFS在 web 开发中的应用................................. - 35 -
10、Mapreduce中 value集合的二次排序 ...................... - 38 -
11、Hive SQL手册翻译 .................................. - 47 -
12、Mahout Kmeans 简介 ................................... - 57 -
hadoop 开发者第二期发布版v3.zip (1.92 MB)