[转]Mahout聚类算法Canopy+K-means测试实例
Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于hadoop分布式的实现,都是非常好的学习资料。
这里主要参考以下几篇文章,并且提供测试数据,有兴趣的可以实战以下。
1、http://my.oschina.net/BreathL/blog/58104
2、http://www.cnblogs.com/vivounicorn/archive/2011/09/23/2186483.html
3、http://www.cnblogs.com/vivounicorn/archive/2011/10/08/2201986.html
测试数据请到这个地方下载:http://download.csdn.net/detail/yuandianlws/4745470
作者:yuandianlws 发表于2012-11-8 11:19:19 原文链接
阅读:843 评论:0 查看评论