第九次作业---K-means算法应用:图片压缩

读取一张示例图片或自己准备的图片,观察图片存放数据特点。

from sklearn.datasets import load_sample_image 
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np

china = load_sample_image("china.jpg")#读取图片
plt.imshow(china)
plt.show()
print(china.shape)#观察图片存放数据特点
china

根据图片的分辨率,可适当降低分辨率。

image = china[::3, ::3] #降低分辨率
X = image .reshape(-1,3)
plt.imshow(image)
plt.show()
print(image.shape,X.shape)

再用k均值聚类算法,将图片中所有的颜色值做聚类。

然后用聚类中心的颜色代替原来的颜色值。

形成新的图片。

n_colors =64 #(256,256,256)
model = KMeans(n_colors) #k均值聚类算法,将图片中所有的颜色值做聚类
labels = model.fit_predict(X) #每个点的颜色分类,0-63
colors = model.cluster_centers_ #64个聚类中心,颜色值

new_image=colors[labels]  #用聚类中心的颜色代替原来的颜色值
new_image=new_image.reshape(image.shape) #形成新的照片
plt.imshow(new_image.astype(np.uint8))
plt.show()

观察原始图片与新图片所占用内存的大小。

将原始图片与新图片保存成文件,观察文件的大小。

import matplotlib.image as img
img.imsave('F:\\china.jpg',china)
img.imsave('F:\\china_zip.jpg',image)

 

理解贝叶斯定理:

  • M桶:7红3黄
  • N桶:1红9黄
  • 现在:拿出了一个红球
  • 试问:这个红球是M、N桶拿出来的概率分别是多少?

 

posted @ 2018-11-02 12:14  a-庄儿  阅读(555)  评论(0编辑  收藏  举报