python图像处理库PIL

基本概念

PIL中所涉及的基本概念有如下几个：通道（bands）、模式（mode）、尺寸（size）、坐标系统（coordinate system）、调色板（palette）、信息（info）和滤波器（filters）。

通道

每张图片都是由一个或者多个数据通道构成。PIL允许在单张图片中合成相同维数和深度的多个通道。

以RGB图像为例，每张图片都是由三个数据通道构成，分别为R、G和B通道。而对于灰度图像，则只有一个通道。

对于一张图片的通道数量和名称，可以通过方法getbands()来获取。

　　方法getbands()是Image模块的方法，它会返回一个字符串元组（tuple）。该元组将包括每一个通道的名称。

模式

图像的模式定义了图像的类型和像素的位宽。当前支持如下模式：

1：1位像素，表示黑和白，但是存储的时候每个像素存储为8bit。
L：8位像素，表示黑和白。
P：8位像素，使用调色板映射到其他模式。
RGB：3x8位像素，为真彩色。
RGBA：4x8位像素，有透明通道的真彩色。
CMYK：4x8位像素，颜色分离。
YCbCr：3x8位像素，彩色视频格式。
I：32位整型像素。
F：32位浮点型像素。
PIL也支持一些特殊的模式，包括RGBX（有padding的真彩色）和RGBa（有自左乘alpha的真彩色）。

可以通过mode属性读取图像的模式。其返回值是包括上述模式的字符串。

尺寸

通过size属性可以获取图片的尺寸。这是一个二元组，包含水平和垂直方向上的像素数。

坐标系统

PIL使用笛卡尔像素坐标系统，坐标(0，0)位于左上角。

　　注意：坐标值表示像素的角；位于坐标（0，0）处的像素的中心实际上位于（0.5，0.5）。

坐标经常用于二元组（x，y）。长方形则表示为四元组，前面是左上角坐标。例如，一个覆盖800x600的像素图像的长方形表示为（0，0，800，600）。

调色板

调色板模式 ("P")使用一个颜色调色板为每个像素定义具体的颜色值

信息

使用info属性可以为一张图片添加一些辅助信息。这个是字典对象。加载和保存图像文件时，多少信息需要处理取决于文件格式。

滤波器

对于将多个输入像素映射为一个输出像素的几何操作，PIL提供了4个不同的采样滤波器：

NEAREST：最近滤波。从输入图像中选取最近的像素作为输出像素。它忽略了所有其他的像素。
BILINEAR：双线性滤波。在输入图像的2x2矩阵上进行线性插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。
BICUBIC：双立方滤波。在输入图像的4x4矩阵上进行立方插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。
ANTIALIAS：平滑滤波。这是PIL 1.1.3版本中新的滤波器。对所有可以影响输出像素的输入像素进行高质量的重采样滤波，以计算输出像素值。还可以用于改变尺寸和缩略图。

Image类的方法

New

定义：Image.new(mode,size) ⇒ image　　|　　Image.new(mode, size, color) ⇒ image

　　含义：使用给定的变量mode和size生成新的图像。

　　　　Size是给定的宽/高二元组，这是按照像素数来计算的。

　　　　对于单通道图像，变量color只给定一个值；对于多通道图像，变量color给定一个元组（每个通道对应一个值）。　　|　　在版本1.1.4及其之后，用户也可以用颜色的名称，如果没有对变量color赋值，图像内容将会被全部赋值为0（图像即为黑色）。如果变量color是空，图像将不会被初始化，即图像的内容全为0。这对向该图像复制或绘制某些内容是有用的。

Open

定义：Image.open(file) ⇒ image　　|　　Image.open(file, mode) ⇒ image

　　含义：打开并确认给定的图像文件。这个是一个懒操作；

　　　　该函数只会读文件头，而真实的图像数据直到试图处理该数据才会从文件读取（调用load()方法将强行加载图像数据）。如果变量mode被设置，那必须是“r”。

　　　　用户可以使用一个字符串（表示文件名称的字符串）或者文件对象作为变量file的值。文件对象必须实现read()，seek()和tell()方法，并且以二进制模式打开。

Blend

定义：Image.blend(image1,image2, alpha) ⇒ image

　　含义：使用给定的两张图像及透明度变量alpha，插值出一张新的图像。这两张图像必须有一样的尺寸和模式。

　　　　合成公式为：out = image1 *(1.0 - alpha) + image2 * alpha

　　　　　　如果变量alpha为0.0，将返回第一张图像的拷贝。

　　　　　　如果变量alpha为1.0，将返回第二张图像的拷贝。对变量alpha的值没有限制。

Composite

定义：Image.composite(image1,image2, mask) ⇒ image

　　含义：使用给定的两张图像及mask图像作为透明度，插值出一张新的图像。

　　　　变量mask图像的模式可以为“1”，“L”或者“RGBA”。所有图像必须有相同的尺寸。

Eval

定义：Image.eval(image,function) ⇒ image

　　含义：使用变量function对应的函数（该函数应该有一个参数）处理变量image所代表图像中的每一个像素点。如果变量image所代表图像有多个通道，那变量function对应的函数作用于每一个通道。

　　　　注意：变量function对每个像素只处理一次，所以不能使用随机组件和其他生成器。

Frombuffer

定义：Image.frombuffer(mode,size, data) ⇒ image　　|　　Image.frombuffer(mode, size,data, decoder, parameters) ⇒ image

　　含义：（New in PIL 1.1.4）使用标准的“raw”解码器，从字符串或者buffer对象中的像素数据产生一个图像存储。对于一些模式，这个图像存储与原始的buffer（这意味着对原始buffer对象的改变体现在图像本身）共享内存。并非所有的模式都可以共享内存；支持的模式有“L”，“RGBX”，“RGBA”和“CMYK”。对于其他模式，这个函数与fromstring()函数一致。

　　　　注意：版本1.1.6及其以下，这个函数的默认情况与函数fromstring()不同。这有可能在将来的版本中改变，所以为了最大的可移植性，当使用“raw”解码器时，推荐用户写出所有的参数　　

Fromstring

定义：Image.fromstring(mode,size, data) ⇒ image　　|　　Image.fromstring(mode, size,data, decoder, parameters) ⇒ image

　　含义：函数Image.fromstring(mode,size, data)，使用标准的“raw”解码器，从字符串中的像素数据产生一个图像存储。

　　函数Image.fromstring(mode,size, data, decoder, parameters)也一样，但是允许用户使用PIL支持的任何像素解码器。

　　　　注意：这个函数只对像素数据进行解码，而不是整个图像。如果用户的字符串包含整个图像，可以将该字符串包裹在StringIO对象中，使用函数open()来加载。

Merge

定义：Image.merge(mode,bands) ⇒ image

　　含义：使用一些单通道图像，创建一个新的图像。

　　　　变量bands为一个图像的元组或者列表，每个通道的模式由变量mode描述。

　　　　所有通道必须有相同的尺寸。变量mode与变量bands的关系：len(ImageMode.getmode(mode).bands)= len(bands)

Image类的函数

Convert

定义1：im.convert(mode)⇒ image

　　含义1：将当前图像转换为其他模式，并且返回新的图像。

　　　　当从一个调色板图像转换时，这个方法通过这个调色板来转换像素。

　　　　如果不对变量mode赋值，该方法将会选择一种模式，在没有调色板的情况下，使得图像和调色板中的所有信息都可以被表示出来。

　　当从一个颜色图像转换为黑白图像时，PIL库使用ITU-R601-2 luma转换公式：L = R * 299/1000 + G * 587/1000 + B * 114/1000.

　　当转换为2位图像（模式“1”）时，源图像首先被转换为黑白图像。结果数据中大于127的值被设置为白色，其他的设置为黑色；这样图像会出现抖动。如果要使用其他阈值，更改阈值127，可以使用方法point()。为了去掉图像抖动现象，可以使用dither选项。

定义2：im.convert(“P”,**options) ⇒ image

　　含义2：这个与第一个方法定义一样，但是当“RGB”图像转换为8位调色板图像时能更好的处理。可供选择的选项为：

　　　　Dither=. 控制颜色抖动。默认是FLOYDSTEINBERG，与邻近的像素一起承担错误。不使能该功能，则赋值为NONE。

　　　　Palette=. 控制调色板的产生。默认是WEB，这是标准的216色的“web palette”。要使用优化的调色板，则赋值为ADAPTIVE。

　　　　Colors=. 当选项palette为ADAPTIVE时，控制用于调色板的颜色数目。默认是最大值，即256种颜色。

定义3：im.convert(mode,matrix) ⇒ image

　　含义3：使用转换矩阵将一个“RGB”图像转换为“L”或者“RGB”图像。变量matrix为4或者16元组。

Crop

定义：im.crop(box) ⇒ image

　　含义：从当前的图像中返回一个矩形区域的拷贝。变量box是一个四元组，定义了左、上、右和下的像素坐标。

　　　　这是一个懒操作。对源图像的改变可能或者可能不体现在裁减下来的图像中。为了获取一个分离的拷贝，对裁剪的拷贝调用方法load()。

Draft

定义：im.draft(mode,size)

　　含义：配置图像文件加载器，使得返回一个与给定的模式和尺寸尽可能匹配的图像的版本。

　　　　例如，用户可以使用这个方法，在加载一个彩色JPEG图像时将其转换为灰色图像，或者从一个PCD文件中提取一个128x192的版本。

　　　　注意：这个方法会适时地修改图像对象（精确地说，它会重新配置文件的读取器）。如果图像已经被加载，那这个方法就没有作用了。

Filter

定义：im.filter(filter) ⇒ image

含义：返回一个使用给定滤波器处理过的图像的拷贝。

Fromstring

定义：im.fromstring(data)　　|　　im.fromstring(data, decoder,parameters)

　　含义：与函数fromstring()一样，但是这个方法会将data加载到当前的图像中。

Getbands

定义：im.getbands()⇒ tuple of strings

　　含义：返回包括每个通道名称的元组。

Getbbox

定义：im.getbbox() ⇒ 4-tuple or None

　　含义：计算图像非零区域的包围盒。这个包围盒是一个4元组，定义了左、上、右和下像素坐标。如果图像是空的，这个方法将返回空。

Getcolors

定义：im.getcolors() ⇒ a list of(count, color) tuples or None　　|　　im.getcolors(maxcolors) ⇒ a list of (count, color) tuples or None

　　含义：（New in 1.1.5）返回一个（count，color）元组的无序list，其中count是对应颜色在图像中出现的次数。

　　如果变量maxcolors的值被超过，该方法将停止计算并返回空。变量maxcolors默认值为256。为了保证用户可以获取图像中的所有颜色，you can pass in size[0]*size[1]（请确保有足够的内存做这件事）。

Getdata

定义：im.getdata() ⇒ sequence

　　含义：以包含像素值的sequence对象形式返回图像的内容。这个sequence对象是扁平的，以便第一行的值直接跟在第零行的值后面，等等。

　　　　注意：这个方法返回的sequence对象是PIL内部数据类型，它只支持某些sequence操作，包括迭代和基础sequence访问。

　　　　使用list(im.getdata())，将它转换为普通的sequence。

Getextrema

定义：im.getextrema() ⇒ 2-tuple

　　含义：返回一个2元组，包括该图像中的最小和最大值。

Getpixel

定义：im.getpixel(xy) ⇒ value or tuple

　　含义：返回给定位置的像素值。如果图像为多通道，则返回一个元组。

　　　　注意：该方法执行比较慢；如果用户需要使用python处理图像中较大部分数据，可以使用像素访问对象（见load），或者方法getdata()。

Histogram

定义1：im.histogram()⇒ list

　　含义1：返回一个图像的直方图。这个直方图是关于像素数量的list，图像中的每个像素值对应一个成员。如果图像有多个通道，所有通道的直方图会连接起来（例如，“RGB”图像的直方图有768个值）。

　　　　二值图像（模式为“1”）当作灰度图像（模式为“L”）处理。

定义2：im.histogram(mask)⇒ list

　　含义2：返回图像中模板图像非零地方的直方图。模板图像与处理图像的尺寸必须相同，并且要么是二值图像（模式为“1”），要么为灰度图像（模式为“L”）。

Load

定义：im.load()

　　含义：为图像分配内存并从文件中加载它（或者从源图像，对于懒操作）。正常情况下，用户不需要调用这个方法，因为在第一次访问图像时，Image类会自动地加载打开的图像。

　　（New in 1.1.6）在1.1.6及以后的版本，方法load()返回一个用于读取和修改像素的像素访问对象。这个访问对象像一个二维队列，如：

　　pix = im.load()

　　print pix[x, y]

　　pix[x, y] =value

　　通过这个对象访问比方法getpixel()和putpixel()快很多。

Offset

定义：im.offset(xoffset,yoffset) ⇒ image

　　含义：返回按照给定位置的偏移对应的图像的拷贝。数据延续到图像的边缘。如果变量yoffset没有赋值，将假设其与变量xoffset一样。

　　　　使用这个方法，在PIL 1.2版本中去掉该方法。新的代码将使用ImageChops模块中的offset()函数。

Paste

定义1：im.paste(image,box)

　　含义1：将一张图粘贴到另一张图像上。变量box或者是一个给定左上角的2元组，或者是定义了左，上，右和下像素坐标的4元组，或者为空（与（0，0）一样）。如果给定4元组，被粘贴的图像的尺寸必须与区域尺寸一样。

　　　　如果模式不匹配，被粘贴的图像将被转换为当前图像的模式。

定义2：im.paste(colour,box)

　　含义2：它与定义1一样，但是它使用同一种颜色填充变量box对应的区域。对于单通道图像，变量colour为单个颜色值；对于多通道，则为一个元组。

定义3：im.paste(image,box, mask)

　　含义3：与定义1一样，但是它使用变量mask对应的模板图像来填充所对应的区域。可以使用模式为“1”、“L”或者“RGBA”的图像作为模板图像。模板图像的尺寸必须与变量image对应的图像尺寸一致。如果变量mask对应图像的值为255，则模板图像的值直接被拷贝过来；如果变量mask对应图像的值为0，则保持当前图像的原始值。变量mask对应图像的其他值，将对两张图像的值进行透明融合。

　　　　注意：如果变量image对应的为“RGBA”图像，即粘贴的图像模式为“RGBA”，则alpha通道被忽略。用户可以使用同样的图像作为原图像和模板图像。

定义4：im.paste(colour,box, mask)

　　含义4：与定义3一样，只是使用变量colour对应的单色来填充区域。

Point

定义1：im.point(table)⇒ image　　|　　im.point(function) ⇒ image

　　含义1：返回给定查找表对应的图像像素值的拷贝。变量table为图像的每个通道设置256个值。如果使用变量function，其对应函数应该有一个参数。这个函数将对每个像素值使用一次，结果表格将应用于图像的所有通道。

　　如果图像的模式为“I（整数）”或者“F（浮点）”，用户必须使用function方式，function必须按照下面的格式：argument * scale+ offset

定义2：im.point(table,mode) ⇒ image　　|　　im.point(function, mode) ⇒ image

　　含义2：与定义1一样，但是它会为输出图像指定一个新的模式。这个方法可以一步将模式为“L”和“P”的图像转换为模式为“1”的图像。

　　（New in 1.1.5）这个方法也可以将“L”图像转换为“I”和“F”模式，或者将16 位的“I”模式图像转换为“L”模式，此时必须使用65536项的查找表。

Putalpha

定义：im.putalpha(band)

　　含义：将给定的通道拷贝到图像的alpha层。此处的图像模式必须为“RGBA”，变量band必须为“L”或者“1”。

　　（New in PIL 1.1.5）方法putalpha()也可以用于其他模式；图像原地转换为有alpha通道的模式（通常转换为“LA”或者“RGBA”）。变量band要么为图像，要么为颜色值（一个整数）。

Putdata

定义：im.putdata(data)　　|　　im.putdata(data, scale, offset)

　　含义：从sequence对象中拷贝数据到当前图像，从图像的左上角（0，0）位置开始。变量scale和offset用来调整sequence中的值：pixel = value *scale + offset

　　　　如果变量scale忽略，则默认为1.0。如果变量offset忽略，则默认为0.0。

Putpalette

定义：im.putpalette(sequence)

　　含义：为“P”或者“L”图像增加一个调色板。对于“L”图像，它的模式将变化为“P”。调色板序列需要包含768项整数，每组三个值表示对应像素的红，绿和蓝。用户可以使用768个byte的字符串代替这个整数序列。

Putpixel

定义：im.putpixel(xy,colour)

　　含义：修改指定位置上的像素值。对于单通道图像，变量colour为一个数值；对于多通道图像，变量colour为一个元组。

　　注意：这个方法执行比较慢。如果是1.1.6版本，像素访问对象（参考load方法）提供了一个更快的方法修改图像。如果用户要生成整幅图像，可以使用更有效的方法产生一个python list，然后使用方法putdata()将它拷贝到图像上去。对于更大的改变，使用方法paste或者ImageDraw模块。

Quantize

定义：im.quantize(colors,**options) ⇒ image

　　含义：使用给定的颜色将“L”或者“RGB”图像转换为“P”图像，返回新的图像。

　　　　新的代码中，使用有自适应的调色板的convert方法来代替：out =im.convert("P", palette=Image.ADAPTIVE,colors=256)

Resize

定义：im.resize(size) ⇒ image　　|　　im.resize(size, filter) ⇒ image

　　含义：返回改变尺寸的图像的拷贝。变量size是所要求的尺寸，是一个二元组：（width, height）。

　　　　变量filter为NEAREST、BILINEAR、BICUBIC或者ANTIALIAS之一。如果忽略，或者图像模式为“1”或者“P”，该变量设置为NEAREST。

　　注意：在当前的版本中bilinear和bicubic滤波器不能很好地适应大比例的下采样（例如生成缩略图）。用户需要使用ANTIALIAS，除非速度比质量更重要。

Rotate

定义：im.rotate(angle) ⇒ image　　|　　im.rotate(angle,filter=NEAREST, expand=0) ⇒ image

　　含义：返回一个按照给定角度顺时钟围绕图像中心旋转后的图像拷贝。

　　　　变量filter应该是NEAREST、BILINEAR或者BICUBIC之一。如果省略该变量，或者图像模式为“1”或者“P”，则默认为NEAREST。

　　　　变量expand，如果为true，表示输出图像足够大，可以装载旋转后的图像。如果为false或者缺省，则输出图像与输入图像尺寸一样大。

Save

定义：im.save(outfile,options…)　　|　　im.save(outfile, format, options…)

　　含义：使用给定的文件名保存图像。如果变量format缺省，如果可能的话，则从文件名称的扩展名判断文件的格式。该方法返回为空。

　　　　关键字options为文件编写器提供一些额外的指令。如果编写器不能识别某个选项，它将忽略它。

　　　　用户可以使用文件对象代替文件名称。在这种情况下，用户必须指定文件格式。文件对象必须实现了seek()、tell()和write()方法，且其以二进制模式打开。

　　　　如果方法save()因为某些原因失败，这个方法将产生一个异常（通常为IOError异常）。如果发生了异常，该方法也有可能已经创建了文件，并向文件写入了一些数据。如果需要的话，用户的应用程序可以删除这个不完整的文件。

原文链接：https://blog.csdn.net/icamera0/article/details/50683106

posted @ 2019-08-19 09:45 JamJarBranch 阅读(1064) 评论(0) 收藏举报

刷新页面返回顶部

JamJarBranch

python图像处理库PIL

基本概念

通道

模式

尺寸

坐标系统

调色板

信息

滤波器

Image类的方法

Image类的函数

公告