Rinkong贝比

导航

3.K均值算法

(1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

第一次选取的聚类中心数:5 、13、8

 

 

 

(2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

iris = load_iris()

mh=iris.data[:,1]  

x=mh.reshape(-1,1)

p = KMeans(n_clusters=3)

p.fit(x)    #训练数据

y_kmeans = p.predict(x

plt.scatter(x[:, 0], x[:, 0], c=y_kmeans, s=50, marker=‘.‘,cmap=‘rainbow‘);

plt.show()

(3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

 

(4). 鸢尾花完整数据做聚类并用散点图显示.

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

 

iris = load_iris()

x = iris.data              

model = KMeans(n_clusters=3)  

model.fit(x)               

y = model.predict(x)          

print("预测结果:", y)

k = model.cluster_centers_     

print("聚类中心:", k)

plt.scatter(x[:, 2], x[:, 3], c=y, s=50, cmap=‘rainbow‘,marker=‘.‘)

plt.show()

 

 

(5).想想k均值算法中以用来做什么?

k均值算法是聚类算法,最适合用于分类。例如消费群体的分类,可根据顾客的消费次数,和每次的消费水平来入手,对他们进行群体的划分。

posted on 2020-06-14 03:17  Rinkong贝比  阅读(29)  评论(0编辑  收藏  举报