Hadoop:你所不知道的一些相关项目

Hadoop:你所不知道的一些相关项目

根据Hadoop Wiki上的说法很多公司都在用Hadoop,但是并没有多少可实质上借鉴的代码

而下面这些开源的基于Hadoop的项目你听说过吗?

0. Hadoop上的机器学习Mahout

http://lucene.apache.org/mahout/

1. Cascading:

类似管道状的工作流包装库,和 Pig 项目类似

http://www.cascading.org/documentation/overview.html


2. MR-Lingo : Hadoop上实现的一种聚类算法

http://code.google.com/p/mr-lingo/


3. Hadoop上实现的PageRank和Canopy Clustering

http://code.google.com/p/canopy-clustering/


4. 使用计算Wikipedia的PageRank
http://distsystems-course.googlecode.com/svn/trunk/


5. 将安全功能加入到Nutch中
http://code.google.com/p/cs513ants/


6. 用Hadoop测试统计Google Code
http://code.google.com/p/udrends/

7. 一个研究Hadoop,Nutch的博客,这个家伙有几把刷子

http://blog.foofactory.fi/2007/11/javascript-prototyping-for-hadoop.html

 

posted @ 2010-04-27 22:09  searchDM  阅读(353)  评论(0编辑  收藏  举报