kalor

导航

 

2013年7月9日

摘要: 转自:http://www.cnblogs.com/vivounicorn/archive/2011/09/23/2186483.htmlMahout学习——Canopy Clustering 聚类是机器学习里很重要的一类方法,基本原则是将“性质相似”(这里就有相似的标准问题,比如是基于概率分布模型的相似性又或是基于距离的相似性)的对象尽可能的放在一个Cluster中而不同Cluster中 对象尽可能不相似。对聚类算法而言,有三座大山需要爬过去:(1)、a large number of clusters,(2)、a high feature dimensionality,(3)、a larg 阅读全文
posted @ 2013-07-09 11:10 kalor 阅读(480) 评论(0) 推荐(0) 编辑