摘要: 只有这个算法思想比较对,其他的都没有一开始的remove:原网址:http://www.shahuwang.com/?p=1021CanopyClustering这个算法是2000年提出来的,此后与Hadoop配合,已经成为一个比较流行的算法了。确切的说,这个算法获得的并不是最终结果,它是为其他算法... 阅读全文
posted @ 2014-05-27 22:51 JamesFan 阅读(13128) 评论(0) 推荐(2) 编辑
摘要: 环境:mahout-0.8hadoop-1.1.2ubuntu-12.04理论这里就不说了,直接上实例:下面举一个例子。数据准备:canopy.dat文件,COPY到HDFS上,文件内容如下:8.1 8.1 7.1 7.1 6.2 6.2 7.1 7.1 2.1 2.1 1.1 ... 阅读全文
posted @ 2014-05-27 16:42 JamesFan 阅读(501) 评论(0) 推荐(0) 编辑
摘要: Mahout – Clustering (聚类篇)Leave a reply什么是Mahout?” Apache Mahout™ project’s goal is to build a scalable machine learning library ”我来拓展一下:(1) Mahout 是Ap... 阅读全文
posted @ 2014-05-27 16:23 JamesFan 阅读(898) 评论(1) 推荐(0) 编辑
摘要: Mahout canopy聚类分类:机器学习2014-05-23 15:37192人阅读评论(0)收藏举报mahout机器学习目录(?)[-]Canopy 聚类一Canopy算法流程二MapReduce实现一簇定义二发现中心点三划分数据三API说明四参考文献Canopy 聚类一、Canopy算法流程... 阅读全文
posted @ 2014-05-27 16:11 JamesFan 阅读(281) 评论(0) 推荐(0) 编辑