聚类模型

聚类模型(欧式距离)

分类与聚类,分类是有监督的学习,聚类是无监督的学习

K均值算法

第一步:假设有一组样本,随机选择k个样本,作为k个聚类的中心,计算距离,将样本划分到离自己最近的类别里。(比如喜欢看的电影:1,30,1【爱情,30分钟,1 高清】1,31,1)

注意:1,聚类数K必须事先已知,

   2,聚类中心的初始选择会影响最终聚类划分的结果。初始中心尽量选择距离较远的样本

K均值的相关API:

model.fit(x)  #输出类别标签 ,从0开始

model  = SC.KMeans(n_clusters = 4)#几个聚类中心

y=model.predict(x) #预测x中每个样本的类别标签

y = model.labels_  #直接返回每个训练样本的类别标签

 

#获取训练结果的聚类中心

centers = model.cluster_centers_

 

posted @ 2020-03-24 16:13  初学者小明  阅读(1210)  评论(0编辑  收藏  举报