K-means clustering (K-means聚类)
问题:
K-所有值聚类是无监督学习算法
设数据集。当中,。
如果这个数据能够分为类。
把这个问题模型化:
,
当中代表第类的聚点(中心点、均值)。
该模型能够用EM算法进行训练:
初始化,。
E步:固定。最小化,显然
。
当中。
M步:固定。最小化
,,
。
直至收敛。
—————————————————————————————————————————————————————
以下介绍一款机器学习软件,便于理解各种机器学习算法,下载完后。解压。
第一步:
双击,进入图形界面。
第二步:在空白处,首先左击几次
然后,右击几次
数据集准备好之后,就開始选择算法,点击菜单条
中的
比方,我们用欧几里得距离,选择2个分类,然后点击“Cluster”button,看结果就能够了。
。
—————————————————————————————————————————————————————
对于K-means算法的实现:
JAVA中Weka,OpenCV,Python中的Scikit-Learn等。
版权声明:本文博客原创文章,博客,未经同意,不得转载。