[转]Mahout聚类算法Canopy+K-means测试实例

        Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于hadoop分布式的实现,都是非常好的学习资料。

        这里主要参考以下几篇文章,并且提供测试数据,有兴趣的可以实战以下。

1、http://my.oschina.net/BreathL/blog/58104

2、http://www.cnblogs.com/vivounicorn/archive/2011/09/23/2186483.html

3、http://www.cnblogs.com/vivounicorn/archive/2011/10/08/2201986.html

 

测试数据请到这个地方下载:http://download.csdn.net/detail/yuandianlws/4745470

 

 

 

 

作者:yuandianlws 发表于2012-11-8 11:19:19 原文链接
阅读:843 评论:0 查看评论
posted @ 2012-11-08 11:19  htrace  阅读(169)  评论(0编辑  收藏  举报