在python3下用PIL做图像处理
Python Imaging Library (PIL)是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。
目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载地址 http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil
或者直接点下面:
- PIL-1.1.7.win32-py3.2.exe [994 KB] [Python 3.2] [32 bit] [Jul 03, 2012]
- PIL-1.1.7.win32-py3.3.exe [988 KB] [Python 3.3b1] [32 bit] [Jul 03, 2012]
最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.7 ,用起来非常方便。大家可以在 http://www.pythonware.com/products/pil/index.htm 下载和学习。
在这里,我主要是介绍一下做图像识别时可能会用到的一些 PIL 提供的功能,比如图像增强、还有滤波之类的。最后给出使用 Python 做图像处理与识别的优势与劣势。
基本图像处理
使用 PIL 之前需要 import Image 模块
注意:在python3中,请使用from PIL import Image,不要使用import Image
import Image #python2
from PIL import Image #python3
然后你就可以使用Image.open(‘xx.bmp’) 来打开一个位图文件进行处理了。打开文件你不用担心格式,也不用了解格式,无论什么格式,都只要把文件名丢给 Image.open 就可以了。真所谓 bmp、jpg、png、gif……,一个都不能少。
img = Image.open(‘origin.png’) # 得到一个图像的实例对象 img
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/105b915713a74058a8b805dd5dffcceb.png)
图 1原图
图像处理中,最基本的就是色彩空间的转换。一般而言,我们的图像都是 RGB 色彩空间的,但在图像识别当中,我们可能需要转换图像到灰度图、二值图等不同的色彩空间。 PIL 在这方面也提供了极完备的支持,我们可以:
new_img = img.convert(‘L’)
把 img 转换为 256 级灰度图像, convert() 是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:
· 1 (1-bit pixels, black and white, stored with one pixel per byte)
· L (8-bit pixels, black and white)
· P (8-bit pixels, mapped to any other mode using a colour palette)
· RGB (3x8-bit pixels, true colour)
· RGBA (4x8-bit pixels, true colour with transparency mask)
· CMYK (4x8-bit pixels, colour separation)
· YCbCr (3x8-bit pixels, colour video format)
· I (32-bit signed integer pixels)
· F (32-bit floating point pixels)
怎么样,够丰富吧?其实如此之处,PIL 还有限制地支持以下几种比较少见的色彩模式:LA (L with alpha), RGBX (true colour with padding) and RGBa (true colour with premultiplied alpha)。
下面看一下 mode 为 ‘1’、’L’、’P’时转换出来的图像:
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/f14443bd90b74f4f9d714156dd35f6d8.gif)
图 2 mode = '1'
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/8511e85898a44bf4bd8902fe830a18f8.gif)
图 3 mode = 'L'
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/586b0aefd5b84cee880676449805f843.gif)
图 4 mode = 'P'
convert() 函数也接受另一个隐含参数 matrix,转换矩阵 matrix 是一个长度为4 或者16 tuple。下例是一个转换 RGB 空间到 CIE XYZ 空间的例子:
rgb2xyz = (
0.412453, 0.357580, 0.180423, 0,
0.212671, 0.715160, 0.072169, 0,
0.019334, 0.119193, 0.950227, 0 )
out = im.convert("RGB", rgb2xyz)
除了完备的色彩空间转换能力外, PIL 还提供了resize()、rotate()等函数以获得改变大小,旋转图片等几何变换能力,在图像识别方面,图像实例提供了一个 histogram() 方法来计算直方图,非常方便实用。
图像增强
图像增强通常用以图像识别之前的预处理,适当的图像增强能够使得识别过程达到事半功倍的效果。 PIL 在这方面提供了一个名为 ImageEnhance 的模块,提供了几种常见的图像增强方案:
import ImageEnhance
enhancer = ImageEnhance.Sharpness(image)
for i in range(8):
factor = i / 4.0
enhancer.enhance(factor).show("Sharpness %f" % factor)
上面的代码即是一个典型的使用 ImageEnhance 模块的例子。 Sharpness 是 ImageEnhance 模块的一个类,用以锐化图片。这一模块主要包含如下几个类:Color、Brightness、Contrast和Sharpness。它们都有一个共同的接口 .enhance(factor) ,接受一个浮点参数 factor,标示增强的比例。下面看看这四个类在不同的 factor 下的效果
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/5825d40ae0f549df99e342aa0c429534.gif)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/d96015d0754d41f08647dc815894f5ef.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/7e93135f6fe04b87b7ada0ef04913629.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/77520434439d47e581215a982db95af4.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/6cc251a0067a4af5a0a46a9b175a688a.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/4f2df2149b454d7fa8c8bcc15170df4e.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/d36a9bd9869542f5bbb3a6f3519c8d1e.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/05e8e4288895469e9284860465e4ba37.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/b0599566b758443b983eb37a0ac4b746.png)
图 5 使用Color 进行色彩增强,factor 取值 [0, 4],步进 0.5
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/e1038e8403c74c08ac940babf2e64d5e.gif)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/0c4ae712efb44fc7a57328c1e6fed53c.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/b5d1a48f62a24d4a8607229c4c8abdf5.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/4cd2ae28e2e049aa8db613d297087f77.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/7d6bb44bcbe8423c93fafcbc8e022337.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/7dc67787176d4e299c6f55db64c97e99.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/b32d9a55c1214c779640008df29d8064.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/36359d1eb3524bd7847b2cded7c55f00.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/376a2121991b425aa61ad3c17d8e1188.png)
图 6 用 Birghtness 增强亮度,factor取值[0,4],步进0.5
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/2f3db13678e64ba38c0c965697731749.gif)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/6f7456f4bd1f44a3a784f9c4a73cc857.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/8f1018ae79dd469586c46c582f0f4870.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/59a251551fa34309874077c816a607c5.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/a6263e65f2964f2980be436a713c8b98.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/1f10bf7cdea646cb965e808ddd1a32ef.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/10a23b13304c4afebb20f51f0ababfd8.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/e4ef2a90fe204789a6b850e5d98c90e1.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/b8648bc7943448228c2d3a371bd74ea0.png)
图 7用 Contrast 增强对比度, factor 取值 [0,4],步进0.5
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/72bc4b5b9a944ceda41824738da20769.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/6e10be3591514893b3eff5a2ac0b7a7d.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/01bad57e33144a4b82177ad1f1e501a5.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/b0e362ef4f704927a28958856dd60fea.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/6a204aac6bf340c2ad4c95ab48074b62.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/f4c61612c912488ba3be374dd2cfd4cd.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/91c4a4cf198a4ca882030481e2ccc2b7.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/c6a522c59fca412c83a9f675467734f8.png)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/7409f2ee93c046fdb2970750c59b9171.png)
图 8用 Sharpness 锐化图像,factor取值 [0,4],步进0.5
图像 Filter
PIL 在 Filter 方面的支持是非常完备的,除常见的模糊、浮雕、轮廓、边缘增强和平滑,还有中值滤波、ModeFilter等,简直方便到可以做自己做一个Photoshop。这些 Filter 都放置在 ImageFilter 模块中,ImageFilter主要包括两部分内容,一是内置的 Filter,如 BLUR、DETAIL等,另一部分是 Filter 函数,可以指定不同的参数获得不同的效果。示例如下:
import ImageFilter
im1 = im.filter(ImageFilter.BLUR)
im2 = im.filter(ImageFilter.MinFilter(3))
im3 = im.filter(ImageFilter.MinFilter()) # same as MinFilter(3)
可以看到 ImageFilter 模块的使用非常简单,每一个 Filter 都只需要一行代码就可调用,开发效率非常高。
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/a5e65f4337a24e04a7fd275d18c2e258.png)
图 9使用 BLUR
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/8ec143c4358d45a390adbbc9c7698bd9.png)
图 10使用 CONTOUR
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/15d50813d32242a3b597741c2e1e5271.png)
图 11使用 DETAIL
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/d8141bcc3ab34206939aec6014a50b28.png)
图 12使用 EMBOSS
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/ce9e7a19139e4fe084b0aef0de156f34.png)
图 13使用 EDGE_ENHANCE
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/17560f5dfb644e8d9f93e050b1757b99.png)
图 14使用 EDGE_ENHANCE_MORE
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/aa6b94ee9b964c89a7ad0f3b2204ccd7.png)
图 15使用 FIND_EDGES
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/8ae9c4fb3630455f9101756ce4432e66.png)
图 16使用 SHARPEN
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/abaae387f57c4edebbbb0b52caf3de56.png)
图 17使用 SMOOTH
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/570b17ae469645199568736b5b50e7cf.png)
图 18使用 SMOOTH_MORE
以上是几种内置的 Filter 的效果图,除此之外, ImageFilter 还提供了一些 Filter 函数,下面我们来看看这些可以通过参数改变行为的 Filter 的效果:
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/f18ed465b925443e84156bd27adf05d1.png)
图 19使用 Kernel(),参数:size = (3, 3), kernel = (0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5)
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/e20d44d8fa6a4ad5b0ce84688b683c05.png)
图 20使用 MaxFilter,默认参数
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/a8bf4eb9e140460c8f9ea6b52849c017.png)
图 21使用 MinFilter,默认参数
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/cce283a6f92f4b0b818a2497f242cbf6.png)
图 22使用 MedianFilter,默认参数
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/ef010a1a01a44ddf802c3bf1b3ac0beb.png)
图 23使用 ModeFilter,参数 size = 3
![](http://p.blog.csdn.net/images/p_blog_csdn_net/lanphaday/cdf0142eb6064994a0af672de451fb2b.png)
图 24使用 RankFilter,参数 size = 3, rank = 3
小结
到此,对 PIL 的介绍就告一段落了。总的来说,对于图像处理和识别,PIL 内建了强大的支持,从各种增强算法到 Filter ,都让人无法怀疑使用 Python 的可行性。 Python唯一的劣势在于执行时间过慢,特别是当实现一些计算量大的算法时候,需要极强的耐心。我曾用 Hough Transform(霍夫变换)来查找图像中的直线,纯 Python 的实现处理一个 340 * 100 的图片也要花去数秒时间(P4 3.0G + 1G memory)。但使用 PIL 无需关注图像格式、内建的图像增强算法和 Filter 算法,这些优点使 Python 适合用于构造原型和进行实验,在这两方面Python 比 matlab 更加方便。商业的图像识别产品开发,可以考虑已经被 boost accepted的来自 adobe 的开源 C++ 库 gil,可以兼顾执行性能和开发效率。
原文:http://blog.csdn.net/lanphaday/article/details/1852726
本文来自博客园,作者:方倍工作室,转载请注明原文链接:https://www.cnblogs.com/txw1958/archive/2012/02/21/python3-PIL.html
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· .NET 适配 HarmonyOS 进展
· 如何给本地部署的DeepSeek投喂数据,让他更懂你
· 超详细,DeepSeek 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方Dee
· 用 DeepSeek 给对象做个网站,她一定感动坏了
· .NET 8.0 + Linux 香橙派,实现高效的 IoT 数据采集与控制解决方案
· .NET中 泛型 + 依赖注入 的实现与应用