python PIL 图像处理库简介(一)

1. Introduction

#### PIL(Python Image Library)是python的第三方图像处理库，但是由于其强大的功能与众多的使用人数，几乎已经被认为是python官方图像处理库了。其官方主页为:[PIL](http://pythonware.com/products/pil/)。 PIL历史悠久，原来是只支持python2.x的版本的，后来出现了移植到python3的库[pillow](http://python-pillow.org/),pillow号称是`friendly fork for PIL`,其功能和PIL差不多，但是支持python3。本文主要介绍PIL那些最常用的特性与用法,主要参考自:[http://www.effbot.org/imagingbook](http://www.effbot.org/imagingbook)。

2. What PIL can do?

#### PIL可以做很多和图像处理相关的事情: - **图像归档(Image Archives)**。PIL非常适合于图像归档以及图像的批处理任务。你可以使用PIL创建缩略图，转换图像格式，打印图像等等。 - **图像展示(Image Display)**。PIL较新的版本支持包括Tk PhotoImage，BitmapImage还有Windows DIB等接口。PIL支持众多的GUI框架接口，可以用于图像展示。 - **图像处理(Image Processing)**。PIL包括了基础的图像处理函数，包括对点的处理，使用众多的卷积核(convolution kernels)做过滤(filter),还有颜色空间的转换。PIL库同样支持图像的大小转换，图像旋转，以及任意的仿射变换。PIL还有一些直方图的方法，允许你展示图像的一些统计特性。这个可以用来实现图像的自动对比度增强，还有全局的统计分析等。

3. How to use PIL?

3.1 Image class

#### Image类是PIL中的核心类，你有很多种方式来对它进行初始化，比如从文件中加载一张图像，处理其他形式的图像，或者是从头创造一张图像等。下面是PIL Image类中常用的方法: - **open(filename,mode)**(打开一张图像)。下面的代码演示了如何从文件打开一张图像: ```python >>> from PIL import Image >>> Image.open("dog.jpg","r") >>> im = Image.open("dog.jpg","r") >>> print(im.size,im.format,im.mode) (296, 299) JPEG RGB ``` `Image.open`返回一个Image对象，该对象有`size,format,mode`等属性，其中`size`表示图像的宽度和高度(像素表示);`format`表示图像的格式,常见的包括JPEG,PNG等格式;`mode`表示图像的模式，定义了像素类型还有图像深度等，常见的有RGB,HSV等。一般来说'L'(luminance)表示灰度图像,'RGB'表示真彩图像,'CMYK'表示预先压缩的图像。一旦你得到了打开的Image对象之后，就可以使用其众多的方法对图像进行处理了，比如使用`im.show()`可以展示上面得到的图像。 - **save(filename,format)**(保存指定格式的图像) ```python >>> im.save("dog.png",'png') ``` 上面的代码将图像重新保存成png格式。 - **thumbnail(size,resample)**(创建缩略图) ```python >>> im.thumbnail((50,50),resample=Image.BICUBIC) >>> im.show() ``` 上面的代码可以创建一个指定大小(size)的缩略图,需要注意的是，thumbnail方法是原地操作，返回值是None。第一个参数是指定的缩略图的大小，第二个是采样的，有`Image.BICUBIC`，`PIL.Image.LANCZOS`，`PIL.Image.BILINEAR`，`PIL.Image.NEAREST`这四种采样方法。默认是`Image.BICUBIC`。 - **crop(box)**(裁剪矩形区域) ```python >>> im = Image.open("dog.jpg","r") >>> box = (100,100,200,200) >>> region = im.crop(box) >>> region.show() im.crop() ``` 上面的代码在im图像上裁剪了一个box矩形区域，然后显示出来。box是一个有四个数字的元组(upper_left_x,upper_left_y,lower_right_x,lower_right_y),分别表示裁剪矩形区域的左上角x,y坐标,右下角的x,y坐标,规定图像的最左上角的坐标为原点(0,0),宽度的方向为x轴，高度的方向为y轴，每一个像素代表一个坐标单位。crop()返回的仍然是一个Image对象。 - **transpose(method)**(图像翻转或者旋转) ```python >>> im_rotate_180 = im.transpose(Image.ROTATE_180) >>> im_rotate_180.show() ``` 上面的代码将im逆时针旋转180°，然后显示出来,`method`是transpose的参数，表示选择什么样的翻转或者旋转方式，可以选择的值有: - Image.FLIP_LEFT_RIGHT,表示将图像左右翻转 - Image.FLIP_TOP_BOTTOM,表示将图像上下翻转 - Image.ROTATE_90,表示将图像逆时针旋转90° - Image.ROTATE_180,表示将图像逆时针旋转180° - Image.ROTATE_270,表示将图像逆时针旋转270° - Image.TRANSPOSE,表示将图像进行转置(相当于顺时针旋转90°) - Image.TRANSVERSE,表示将图像进行转置,再水平翻转 - **paste(region,box,mask)(将一个图像粘贴到另一个图像)** ```python >>> im.paste(region,(100,100),None) >>> im.show() ``` 上面的代码将region图像粘贴到左上角为(100,100)的位置。region是要粘贴的Image对象,box是要粘贴的位置，可以是一个两个元素的元组，表示粘贴区域的左上角坐标,也可以是一个四个元素的元组，表示左上角和右下角的坐标。如果是四个元素元组的话,box的size必须要和region的size保持一致，否则将会被convert成和region一样的size。 - **split()**(颜色通道分离) ```python >>> r,g,b = im.split() >>> r.show() >>> g.show() >>> b.show() ``` split()方法可以原来图像的各个通道分离,比如对于RGB图像，可以将其R,G,B三个颜色通道分离。 - **merge(mode,channels)**(颜色通道合并) ```python >>> im_merge = Image.merge("RGB",[b,r,g]) >>> im_merge.show() ``` merge方法和split方法是相对的，其将多个单一通道的序列合并起来，组成一个多通道的图像，mode是合并之后图像的模式，比如"RGB",channels是多个单一通道组成的序列。 - **resize(size,resample,box)** ```python >>> im_resize = im.resize((200,200)) >>> im_resize >>> im_resize.show() >>> im_resize_box = im.resize((100,100),box = (0,0,50,50)) >>> im_resize_box.show() ``` resize方法可以将原始的图像转换大小,size是转换之后的大小,resample是重新采样使用的方法，仍然有`Image.BICUBIC`，`PIL.Image.LANCZOS`，`PIL.Image.BILINEAR`，`PIL.Image.NEAREST`这四种采样方法，默认是`PIL.Image.NEAREST`,box是指定的要resize的图像区域，是一个用四个元组指定的区域(含义和上面所述box一致)。 - **convert(mode,matrix,dither,palette,colors)**(mode转换) ```python >>> im_L = im.convert("L") >>> im_L.show() >>> im_rgb = im_L.convert("RGB") >>> im_rgb.show() >>> im_L.mode 'L' >>> im_rgb.mode 'RGB' ``` convert方法可以改变图像的mode,一般是在'RGB'(真彩图)、'L'(灰度图)、'CMYK'(压缩图)之间转换。上面的代码就是首先将图像转化为灰度图，再从灰度图转化为真彩图。值得注意的是,从灰度图转换为真彩图，虽然理论上确实转换成功了，但是实际上是很难恢复成原来的真彩模式的(不唯一)。 - **filter(filter)**(应用过滤器) ```python >>> im = Image.open("dog.jpg","r") >>> from PIL import ImageFilter >>> im_blur = im.filter(ImageFilter.BLUR) >>> im_blur.show() >>> im_find_edges = im.filter(ImageFilter.FIND_EDGES) >>> im_find_edges.show() >>> im_find_edges.save("find_edges.jpg") >>> im_blur.save("blur.jpg") ``` filter方法可以将一些过滤器操作应用于原始图像，比如模糊操作，查找边、角点操作等。filter是过滤器函数，在`PIL.ImageFilter`函数中定义了大量内置的filter函数，比如`BLUR`(模糊操作),`GaussianBlur`(高斯模糊),`MedianFilter`(中值过滤器)，`FIND_EDGES`(查找边)等。上面得到原始图像dog.jpg,find_edges.jpg以及blur.jpg从左到右如下图1所示:

图1 从左到右分别是:dog.jpg,find_edges.jpg以及blur.jpg

point(lut,mode)(对图像像素操作)

>>> im_point = im.point(lambda x:x*1.5)
>>> im_point.show()
>>> im_point.save("im_point.jpg")

point方法可以对图像进行单个像素的操作，上面的代码对point方法传入了一个匿名函数,表示将图像的每个像素点大小都乘以1.5,mode是返回的图像的模式，默认是和原来图像的mode是一样的。图2是原来的dog.jpg和point操作之后的im_point.jpg之间的对比。

图2 dog.jpg和point操作之后的im_point.jpg 下面是一个结合了`point`函数,`split`函数,`paste`函数以及`merge`函数的小例子。 ```python >>> source = im.split() >>> R,G,B = 0,1,2 >>> mask = source[R].point(lambda x: x<100 and 255) >>> # x<100,return 255,otherwise return 0 >>> out_G = source[G].point(lambda x:x*0.7) >>> # 将out_G粘贴回来，但是只保留'R'通道像素值<100的部分 >>> source[G].paste(out_G,None,mask) >>> # 合并成新的图像 >>> im_new = Image.merge(im.mode,source) >>> im_new.show() >>> im.show() ``` - **ImageEnhance()**(图像增强) ```python >>> from PIL import ImageEnhance >>> brightness = ImageEnhanBce.Brightness(im) >>> im_brightness = brightness.enhance(1.5) >>> im_brightness.show() >>> im_contrast = ImageEnhance.Contrast(im) >>> im_contrast.enhance(1.5) >>> im_contrast.enhance(1.5).show() ``` ImageEnhance是PIL下的一个子类，主要用于图像增强，比如增加亮度(Brightness),增加对比度(Contrast)等。上面的代码将原来图像的亮度增加50%,将对比度也增加了50%。 - **ImageSequence()**(处理图像序列) 下面的代码可以遍历gif图像中的所有帧，并分别保存为图像 ```python >>> from PIL import ImageSequence >>> from PIL import Image >>> gif = Image.open("pipixia.gif") >>> for i,frame in enumerate(ImageSequence.Iterator(gif),1): ... if frame.mode == 'JPEG': ... frame.save("%d.jpg" %i) ... else: ... frame.save("%d.png" % i) ``` 除了上面使用迭代器的方式以外，还可以一帧一帧读取gif,比如下面的代码: ```python >>> index = 0 >>> while 1: ... try: ... gif.seek(index) ... gif.save("%d.%s" %(index,'jpg' if gif.mode == 'JPEG' else 'png')) ... index += 1 ... except EOFError: ... print("Reach the end of gif sequence!") ... break ``` 上面的代码在读取到gif的最后一帧之后，会throw 一个 EOFError,所以我们只要捕获这个异常就可以了。

posted @ 2018-06-04 15:10 lyrichu 阅读(136164) 评论(3) 收藏举报

刷新页面返回顶部

lyrichu

小小攻城狮有大大的梦想

python PIL 图像处理库简介(一)

1. Introduction

2. What PIL can do?

3. How to use PIL?

3.1 Image class

公告