机器学习04-K均值算法--应用
1. 应用K-means算法进行图片压缩
读取一张图片
观察图片文件大小,占内存大小,图片数据结构,线性化
用kmeans对图片像素颜色进行聚类
获取每个像素的颜色类别,每个类别的颜色
压缩图片生成:以聚类中收替代原像素颜色,还原为二维
观察压缩图片的文件大小,占内存大小
(1)查看大小,内存,数据结构并线性化
(2)kmeans进行聚类,获取每个像素的颜色类别,每个类别的颜色
(3)压缩图片生成
原图片: 压缩后图片:
(4)观察压缩图片的文件大小,占内存大小
完整代码:
##图片压缩应用
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import matplotlib.image as img
import numpy as np
import sys
cat = img.imread('1055407.jpg') ##读取图片
print("原图片文件大小:",cat.size) ##查看文件大小
print("原图片占内存大小:",sys.getsizeof(cat)) ##查看占内存大小
print("原图片数据结构:",cat.shape) ##查看数据结构
print("原图片数据:\n",cat) ##查看数据
cats = cat[::8,::8] ##降低分辨率
X = cats.reshape(-1,3) ##线性化
print(cats.shape,X.shape)
n_colors = 64 ##将255*255*255种颜色聚类成64种
model = KMeans(n_colors)
labels = model.fit_predict(X) ##获取每个像素点的颜色类别存放在labels中
colors = model.cluster_centers_ ##将64种颜色存放在colors中,即聚类中心
new_image = colors[labels].reshape(cats.shape) ##reshape回原来的形状
plt.imshow(cat) ##压缩前的图片
plt.show()
plt.imshow(new_image.astype(np.uint8)) ##压缩后的图片
plt.show()
print("压缩后图片文件大小:",new_image.size) ##查看文件大小
print("压缩后图片占内存大小:",sys.getsizeof(new_image)) ##查看占内存大小
img.imsave('cats.jpg',new_image.astype(np.uint8))
2. 观察学习与生活中可以用K均值解决的问题。
从数据-模型训练-测试-预测完整地完成一个应用案例。
这个案例会作为课程成果之一,单独进行评分。