2011 年 12月 16 日随笔档案 - 长颈鹿Giraffe

公告

2011年12月16日

摘要：聚类是信息检索、数据挖掘中的一类重要技术，是分析数据并从中发现有用信息的一种有效手段。它将数据对象分组成为多个类或簇，使得在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别很大。作为统计学的一个分支和一种无监督的学习方法，聚类从数学分析的角度提供了一种准确、细致的分析工具。而k-means算法是最常用和最典型的聚类算法之一，k-means算法是典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。k-means的优点在于能快速的收敛及易于实现，但是该算法在一些数.. 阅读全文

posted @ 2011-12-16 00:20 长颈鹿Giraffe 阅读(6589) 评论(1) 推荐(4) 编辑