摘要: Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于hadoop分布式的实现,都是非常好的学习资料。 这里主要参考以下几篇文章,并且提供测试数据,有兴趣的可以实战以下。 1、http://my... 阅读全文
posted @ 2012-11-08 11:19 htrace 阅读(169) 评论(0) 推荐(0) 编辑