Rinkong贝比

导航

公告

3.K均值算法

（1）. 扑克牌手动演练k均值聚类过程：>30张牌，3类

第一次选取的聚类中心数：5 、13、8

（2）. *自主编写K-means算法，以鸢尾花花瓣长度数据做聚类，并用散点图显示。（加分题）

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

iris = load_iris()

mh=iris.data[:,1]

x=mh.reshape(-1,1)

p = KMeans(n_clusters=3)

p.fit(x) #训练数据

y_kmeans = p.predict(x

plt.scatter(x[:, 0], x[:, 0], c=y_kmeans, s=50, marker=‘.‘,cmap=‘rainbow‘);

plt.show()

（3）. 用sklearn.cluster.KMeans，鸢尾花花瓣长度数据做聚类，并用散点图显示.

（4）. 鸢尾花完整数据做聚类并用散点图显示.

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

iris = load_iris()

x = iris.data

model = KMeans(n_clusters=3)

model.fit(x)

y = model.predict(x)

print("预测结果：", y)

k = model.cluster_centers_

print("聚类中心:", k)

plt.scatter(x[:, 2], x[:, 3], c=y, s=50, cmap=‘rainbow‘,marker=‘.‘)

plt.show()

（5）.想想k均值算法中以用来做什么？

k均值算法是聚类算法，最适合用于分类。例如消费群体的分类，可根据顾客的消费次数，和每次的消费水平来入手，对他们进行群体的划分。

posted on 2020-06-14 03:17 Rinkong贝比阅读(29) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部