Pooling与马赛克的秘密
说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Pooling在中文当中的意思是“池化”,在神经网络当中非常常见,通常用的比较多的一种是Max Pooling,具体操作如下图:
结合图像理解,相信你也会大概明白其中的本意。不过Pooling并不是只可以选取2x2的窗口大小,即便是3x3,5x5等等没问题,步长(Stride)也是一个道理。除了在神经网络方面,Pooling为图片打马赛克也是可以取得不错的效果,结合几个例子看看。
我们可以用Max Pooling先看看效果如何:
Min Pooling和Average Pooling的操作也差不多,只不过把对应的操作函数变了而已。
Min Pooling:
小动物的皮肤颜色都换了,再看看Average Pooling:
综上来看,Average Pooling似乎更加逼真一些,不过换一张图片可能效果就不一样了。
以下是Pooling操作的代码:
import cv2
import numpy as np
def average_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.mean(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
def max_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.max(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
def min_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.min(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
由于是多颜色通道的图片,所以记得别漏了这个参数。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库