Hadoop:你所不知道的一些相关项目
Hadoop:你所不知道的一些相关项目
根据Hadoop Wiki上的说法很多公司都在用Hadoop,但是并没有多少可实质上借鉴的代码
而下面这些开源的基于Hadoop的项目你听说过吗?
0. Hadoop上的机器学习Mahout
http://lucene.apache.org/mahout/
1. Cascading:
类似管道状的工作流包装库,和 Pig 项目类似
http://www.cascading.org/documentation/overview.html
2. MR-Lingo : Hadoop上实现的一种聚类算法
http://code.google.com/p/mr-lingo/
3. Hadoop上实现的PageRank和Canopy Clustering
http://code.google.com/p/canopy-clustering/
4. 使用计算Wikipedia的PageRank
http://distsystems-course.googlecode.com/svn/trunk/
5. 将安全功能加入到Nutch中
http://code.google.com/p/cs513ants/
6. 用Hadoop测试统计Google Code
http://code.google.com/p/udrends/
7. 一个研究Hadoop,Nutch的博客,这个家伙有几把刷子
http://blog.foofactory.fi/2007/11/javascript-prototyping-for-hadoop.html