k均值算法

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

实验总牌数为30,分三类进行三轮迭代。

第一轮:抽取聚类中心为:3、4、7.

 

 聚类结果为:

 

 第二轮:经过求平均后,重新确定聚类中心为:2、4、10

 

 第三轮:对上类再进行求平均,选定聚类中心为2、5、10

 

 

最终聚类中心稳定在2、5、10,以此为小中大划分。

 

 

2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

 

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

代码:

 

散点图显示为:

 

 

 

4). 鸢尾花完整数据做聚类并用散点图显示.

代码:(经上代码修改来的,稍有瑕疵)

 

 散点图:

 

 

 

5).想想k均值算法中可以用来做什么?

  最主要的就是进行机器学习啊,再加上如今是大数据时代,数据足够训练模型简直如虎添翼,

应用到生活中的比如,手机上会自动帮你标记哪些是骚扰电话,就是通过许多用户的数据进行机器学习得到的,比如说童话时常,对用户接起来一秒挂断的电话进行记录,被很多用户一秒挂断,就标记是骚扰电话

posted @ 2020-04-16 21:45  CrJia  阅读(199)  评论(0编辑  收藏  举报