matlab Kmeans算法

                <svg xmlns="http://www.w3.org/2000/svg" style="display: none;">
                    <path stroke-linecap="round" d="M5,0 0,2.5 5,5z" id="raphael-marker-block" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);"></path>
                </svg>
                <hr> 

title: matlab Kmeans算法
tags: 机器学习
category: matlab

参考

http://www.tup.tsinghua.edu.cn/booksCenter/book_07680201.html

代码如下

% 清除工作空间的所有变量,函数,和MEX文件
% 作用: 避免本次的运行受到之前运行的影响
clear all;


% data: 待聚类的数据集
% 这里共有 30 条记录,每条记录含有3个特征
% 注:一行为 1 条记录,一列为 1 个特征
data=[
1702.8	1639.79	2068.74
1877.93	1860.96	1975.3
867.81	2334.68	2535.1
1831.49	1713.11	1604.68
460.69	3274.77	2172.99
2374.98	3346.98	975.31
2271.89	3482.97	946.7
1783.64	1597.99	2261.31
198.83	3250.45	2445.08
1494.63	2072.59	2550.51
1597.03	1921.52	2126.76
1598.93	1921.08	1623.33
1243.13	1814.07	3441.07
2336.31	2640.26	1599.63
354	3300.12	2373.61 
2144.47	2501.62	591.51 
426.31	3105.29	2057.8   
1507.13	1556.89	1954.51 
343.07	3271.72	2036.94   
2201.94	3196.22	935.53   
2232.43	3077.87	1298.87   
1580.1	1752.07	2463.04  
1962.4	1594.97	1835.95  
1495.18	1957.44	3498.02  
1125.17	1594.39	2937.73   
24.22	3447.31	2145.01  
1269.07	1910.72	2701.97  
1802.07	1725.81	1966.35   
1817.36	1927.4	2328.79  
1860.45	1782.88	1875.13   
];


% 此处调用预先定义好的函数,即 api,
% 可以在 matlab 的命令行中输入 open kmeans 查看源码
%  IDX: 聚类结果
%    C: 簇中心
% SUMD: 每一个样本到该簇中心的距离之和
%    D: 每一个样本到各个簇中心的距离
%    K: 分类的个数,这里设置 k 为 4,即将分为 4 个簇
[IDX,C,SUMD,D] = kmeans(data,4);


% 在三维空间以 3 个特征为坐标轴,构建图形
plot3(data(:,1),data(:,2),data(:,3),'*');
grid;


% 找到每一个样本到四个聚类中心的最小距离
D=D' 
minD=min(D); 


% 找到属于不同簇的点
index1 = find(D(1,:) ==min(D))  
index2 = find(D(2,:) ==min(D))  
index3 = find(D(3,:) ==min(D))  
index4 = find(D(4,:) ==min(D))  


% 在图形中对不同的簇加以区分
line(data(index1,1),data(index1,2),data(index1,3),'linestyle', 'none','marker','*','color','g');
line(data(index2,1),data(index2,2),data(index2,3),'linestyle', 'none','marker','*','color','r');
line(data(index3,1),data(index3,2),data(index3,3),'linestyle', 'none','marker','+','color','b');
line(data(index4,1),data(index4,2),data(index4,3),'linestyle', 'none','marker','+','color','y');


% 图形标题、坐标轴标题
title('C均值聚类分析图');
xlabel('第一特征坐标');
ylabel('第二特征坐标');
zlabel('第三特征坐标');


% 输出每个簇的簇中心
C

本文作者:tiansz

本文链接:https://www.cnblogs.com/tiansz/p/16319554.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   tiansz  阅读(81)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起