聚类模型
聚类模型(欧式距离)
分类与聚类,分类是有监督的学习,聚类是无监督的学习
K均值算法
第一步:假设有一组样本,随机选择k个样本,作为k个聚类的中心,计算距离,将样本划分到离自己最近的类别里。(比如喜欢看的电影:1,30,1【爱情,30分钟,1 高清】1,31,1)
注意:1,聚类数K必须事先已知,
2,聚类中心的初始选择会影响最终聚类划分的结果。初始中心尽量选择距离较远的样本
K均值的相关API:
model.fit(x) #输出类别标签 ,从0开始
model = SC.KMeans(n_clusters = 4)#几个聚类中心
y=model.predict(x) #预测x中每个样本的类别标签
y = model.labels_ #直接返回每个训练样本的类别标签
#获取训练结果的聚类中心
centers = model.cluster_centers_