《Hadoop开发者》第二期

fm


目录
1、Hadoop 业界资讯......................................... - 1 -
2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究  ....... - 5 -
3、支持自定义爬虫的Nutch segment 文件存储接口改写.......... - 11 -
4、Nutch 中mapreduce 应用的几个特殊点  .................... - 14 -
5、Java RMI + Lucene 构建分布式检索应用初探  .............. - 17 -
6、一对多的表关联在mapreduce中的应用(续)  ................. - 26 -
7、InputSplit 文件格式分析................................. - 32 -
8、短评:HDFS、MapReduce和HBase 三者相辅相成、各有长处 .... - 34 -
9、HDFS在 web 开发中的应用................................. - 35 -
10、Mapreduce中 value集合的二次排序  ...................... - 38 -
11、Hive SQL手册翻译  .................................. - 47 -
12、Mahout Kmeans 简介  ................................... - 57 -

 

hadoop 开发者第二期发布版v3.zip (1.92 MB)

posted @ 2010-04-08 23:05  spork  阅读(2996)  评论(0编辑  收藏  举报