K-means算法应用:图片压缩
K-means算法应用:图片压缩
1、读取一张示例图片和自己准备的图片,观察图片存放数据特点,并根据图片的分辨率,可适当降低分辨率。
#读取图片 from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt china=load_sample_image("china.jpg") plt.imshow(china) plt.show() print(china.shape) #图片的数据格式 print(china.dtype) print(china.shape) print(china)
结果:
#自己准备的图片 import matplotlib.image as img S=img.imread('f:\\123.png') plt.imshow(S) plt.show() #123t图片的数据特点 print (S.shape) S
结果:
#降低图片的分辨率 SS=S[::3,::3] plt.imshow(SS) plt.show()
结果:
2、再用k均值聚类算法,将图片中所有的颜色值做聚类,然后用聚类中心的颜色代替原来的颜色值,形成新的图片。
#用k均值聚类算法,将图片中所有的颜色值做聚类 import numpy as np china=load_sample_image("china.jpg") plt.imshow(china) plt.show() image=china[::3,::3] A=image.reshape(-1,3) print(china.shape,image.shape,A.shape) n_colors=64 model=KMeans(n_colors) labels=model.fit_predict(A) colors=model.cluster_centers_
结果:
#还原颜色,维数,数据类型 new_image=colors[labels] new_image=new_image.reshape(image.shape) new_image plt.imshow(image) plt.show() plt.imshow(new_image.astype(np.uint8)) plt.show()
结果:
print(A.shape) print(labels.shape,labels) print(colors.shape,colors)
结果:
3、观察原始图片与新图片所占用内存的大小。
import sys print(sys.getsizeof(china)) print(sys.getsizeof(new_image))
结果:
4、将原始图片与新图片保存成文件,观察文件的大小。
5、贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
计算过程,如下图所示: