作业4 .K均值算法--应用

1. 应用K-means算法进行图片压缩

代码如下:

from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import matplotlib.image as img
import numpy as np

flower = img.imread('E:\\flower.jpg')#读取图片
#plt.imshow(flower)
#plt.show()
image = flower[::3,::3]
X = image.reshape(-1,3)
print(flower.shape,image.shape,X.shape)

n_colors = 45 #把像素分为45类
model = KMeans(n_colors)
labels = model.fit_predict(X)#训练并预测  一维数组 元素的类别
colors = model.cluster_centers_#二维(45,3)

new_image = colors[labels].reshape(image.shape)
plt.imshow(image)
plt.show()
plt.imshow(new_image.astype(np.uint8))
plt.show()
plt.imshow(new_image.astype(np.uint8)[::3,::3])
plt.show()
img.imsave('E://flower02.jpg',new_image)

截图如下:

压缩图片生成:以聚类中收替代原像素颜色,还原为二维:

flower截图:                                                           flower02截图:

           

观察压缩图片的文件大小,占内存大小

2. 观察学习与生活中可以用K均值解决的问题

我想的是可以用K均值,统计出餐厅里各个时间段客人点餐的菜品数目,来更好的准备,

比如在什么时候要准备更多的菜品1,在其他时候要准备更多的菜品2

以下是我的代码以及结果截图:

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans

#读取文件
path = r'E:\大3  学期2\机器学习\meal_order.xlsx'
df = pd.read_excel(path)

#选取文件中需要的数据进行KMeans处理
data = df[['amounts','place_order_time']]
data.dtypes
data['place_order_time'] = pd.to_numeric(data['place_order_time'])
data['place_order_time'].dtype
data.dtypes

data
ests = KMeans(n_clusters=3) #取3个中心点,分成3类
ests.fit(data) #训练数据
y_kmeanss = ests.predict(data) #预测数据

#把每个分类放进列表,输出菜单名称
order0 = np.array(df[y_kmeanss==0]['dishes_name'])
order0
order1 = np.array(df[y_kmeanss==1]['dishes_name'])
order1
order2 = np.array(df[y_kmeanss==2]['dishes_name'])
order2

#统计菜品数量,Counter是一个容器对象,主要的作用是用来统计散列对象
from collections import Counter
a = Counter(order0)
print('中午客人点的比较多的菜品排序:',a)
b = Counter(order1)
print('下午客人点的比较多的菜品排序:',b)
c = Counter(order2)
print('晚上客人点的比较多的菜品排序:',c)

截图:

表格中选取需要的数据进行KMeans处理

 

 预测分类之后的结果:

最后结果:

posted @ 2020-04-19 11:09  小婷G899  阅读(189)  评论(0编辑  收藏  举报