作业四

1. 应用K-means算法进行图片压缩。

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import sys
import matplotlib.image as img
import numpy as np

# 读取一张图片
image = img.imread("./3.jpg")
print('原图片文件大小:', image.size)
print('原图片占内存大小:', sys.getsizeof(image))
print('原图片的数据结构:\n', image)

plt.rcParams['font.sans-serif'] = ['SimHei']#解决中文问题
plt.title("原图片")
plt.imshow(image)
plt.show()

# kmeans对图片像素颜色进行聚类
image = image[::3, ::3]  # 降低分辨率
X = image.reshape(-1, 3)
print(image.shape, X.shape)
n_colors = 64
model = KMeans(n_colors)
labels = model.fit_predict(X)  # 获取每个像素的颜色类别
colors = model.cluster_centers_  # 获取每个类别的颜色

new_image = colors[labels].reshape(image.shape)  # 以聚类中收替代原像素颜色,还原为二维
print('压缩图片文件大小:', new_image.size)
print('压缩图片占内存大小:', sys.getsizeof(new_image))
print('压缩图片的数据结构:\n', new_image)
img.imsave('E://img/1.jpg', new_image)
plt.title("压缩图片")
plt.imshow(new_image.astype(np.uint8))  # 把颜色平均值转为整数
plt.show()

 

原图片参数:

 

 

压缩之后:

 

 

由于显示值在0:1之间,所以图片压缩不了,找了很多办法都不行。必须将它们重新缩放到0.0-1.0的范围。我建议你要保持负面和正面的可见性,但是你让0.5作为你的新“中性”点。缩放到当前的0.0值映射到0.5,而您的最大极值(最大值)缩放到0.0(如果为负)或1.0(如果为正)。

 

 

2. 观察学习与生活中可以用K均值解决的问题。

 

import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
data= pd.read_csv('test.csv')
kmeans_model = KMeans(n_clusters=2)
kmeans_model.fit(data)
y_predict1 = kmeans_model.predict(data)
kmeans_model.cluster_centers_
kmeans_model.labels_
plt.scatter(data[1:,3],data[1:,3],c=y_predict1,s=50,cmap="rainbow")
plt.show()

 

观察广州市的房价,数据如下:

 

 

 

 

 

 

 

 

 

 

 

posted @ 2020-04-18 22:36  董学沉啦  阅读(168)  评论(0编辑  收藏  举报