1101 作业
一、读取一张示例图片或自己准备的图片,观察图片存放数据特点。
from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np china = load_sample_image("china.jpg") plt.imshow(china) plt.show()
二、根据图片的分辨率,可适当降低分辨率。
image = china[::3,::3] X = image.reshape(-1,3) print(china.shape,image.shape,X.shape)
三、再用k均值聚类算法,将图片中所有的颜色值做聚类,然后用聚类中心的颜色代替原来的颜色值。
n_color = 64 model = KMeans(n_color) labels = model.fit_predict(X) colors = model.cluster_centers_
四、形成新的图片。
plt.imshow(image);
plt.show()
plt.imshow(image.astype(np.uint8))
plt.show()
五、观察原始图片与新图片所占用内存的大小。将原始图片与新图片保存成文件,观察文件的大小。
import sys print(sys.getsizeof(china)) print(sys.getsizeof(image)) import matplotlib.image as img img.imsave('F:\\china.jpg',china) img.imsave('F:\\china_zip.jpg',image)
理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?