1 opencv-python图像读写模块
这个分类记录自己学习opencv的随笔文档,方便以后查询和复习。python-opencv环境配置网上教程很多,此处就不做赘述了,该文档记录opencv最基础的图像读写和显示,以及图像编码解码,工具是jupyter notebook。
1 opencv中,图像读取函数是 imread(filename, flags=None)
参数说明:
filename:读取图像的路径,通常支持jpg、png、bmp、tiff等格式文件。
flags:图片读入的模式,模式定义在cv::ImreadModels中,默认值为IMREAD_COLOR。还有一个常用的模式是:IMREAD_GRAYSCALE,对应值为 0,以灰度图方式读取图片。
注意:imread函数返回一个BGR形式的图像对象,其类型为一个numpy数组。
2 显示图像的函数是 imshow(window_name, image)
参数说明:window_name是一个字符串,代表要在其中显示图像的窗口的名称。image是它是要显示的图像。
可以用 namedWindow(window_name, flag) 来定义一个窗口,如果没有定义会根据 imshow 的参数自动生成一个窗口。已经定义的窗口可以用 resizeWindow(window_name,width,height) 来改变窗口大小。
import cv2 import numpy as np img=cv2.imread('C:/Users/86188/Desktop/test/python/cat.jpg',cv2.IMREAD_COLOR) #读取图片
cv2.imshow('showimg',img) #显示图片 cv2.waitKey(0) #等待用户操作 cv2.destroyWindow('window') #销毁窗口
3 除了直接用opencv的imshow来显示图片,也可以用matplotlib来显示图片
注意需要在显示的时候进行图片通道翻转(直接用::-1,也可以用cvtColor()函数进行颜色通道翻转),否则显示的图片颜色会异常,因为正常图片的格式是RGB,但是opencv读取进来的格式是BGR。
用opencv来显示图像通常需要好几行代码,可以自己封装成函数,需要的时候直接调用:
4 opencv中图像的属性
在 OpenCV 中,图像是一个 NumPy 数组,我们可以使用numpy数组的属性来访问图像属性:
- 图像类型 - 图像的数据结构。OpenCV中的图像是numpy.ndarray,我们可以将其访问为 type(img) 。
-
图像形状 - 它是以 [H, W, C] 格式表示的形状。其中 H,W 和 C 分别是图像的 高度,宽度和通道数 ,我们可以将其访问为 img.shape 。
-
图像大小 - 它是图像中像素的总数。它也是数组中元素的总数。我们可以将其访问为 img.size 。
-
数据类型 - 它是图像数组元素的dtype。我们可以将其访问为 img.dtype 。
5 图片保存 imwrite(filename,img)
参数说明: filename 表示保存的文件名称,img 是需要保存的图像对象。
创建窗口,读取显示和保存图像的实例如下:
import cv2 #创建窗口 cv2.namedWindow('img',cv2.WINDOW_NORMAL) cv2.resizeWindow('img',640,480) #读取图片 img = cv2.imread('./cat.jpg') while True: cv2.imshow('img',img) key = cv2.waitKey(0) #该函数的返回值为ASCII码,参数0表示:等待 0 毫秒后,用户可以通过按键盘上的任意键来销毁所有窗口。 if key == ord('q'): #如果键盘输入q,退出 break elif key == ord('s'): #如果键盘输入s,保存图片到 当前文件夹下, ord()是把输入的字符转换为对应的ASCII码。 cv2.imwrite('./mycat.png',img) else: print(key) cv2.destroyAllWindows() #销毁当前所有窗口
此外,opencv中也可以进行多幅图像的读取,函数是 imreadmulti(filename) 参数filename是待读取的图像文件路径,返回的结果是tuple类型,包含两个值,第一个为bool类型,表示是否读取成功;第二个参数是list类型,保存读取的图像结果。多幅图像保存可以用imwritemulti(filename,img) .参数filename表示保存的图像文件名称,img是图像数据。
6 图像编码 imencode(ext,img)
参数说明:ext: 文件扩展名,用来决定输出格式。img: 待编码图像数据。
图像编码后保存在文件中,这里涉及到文件的读写操作,Python内置了读写文件的函数 with open语句。常用的读写操作如下:
with open('filename.txt', 'r') as f: content = f.read(f) #文件的读操作
with open('data.txt', 'w') as f: f.write('hello world') #文件的写操作
下面将读取的图像进行编码,然后保存到txt文件中(编码后要把数据转换为二进制)。
import cv2 #图像编码为数据流,方便网络传输 import numpy as np img = cv2.imread('cat.jpg') ret,img_encode = cv2.imencode(' .jpg',img) #图像编码,返回值ret为bool类型,img_encode为返回的数据流,ndarray格式 print(type(img_encode)) bytes_encode = img_encode.tobytes() #把编码的数据类型转换为bytes二进制 print(type(bytes_encode)) with open("imencode.txt","wb") as f: #以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 f.write(bytes_encode) # 把数据存储到文本中
执行完成后,会在当前路径下生成imencode.txt文件,其中保存着编码后的图像数据。但是文本打开没法正常显示二进制,会乱码。
7 图像解码 imdecode(buf, flags)
参数说明:buf: bytes类型的输入数据流,flags: 解码标志,由ImreadModes定义,常用的有IMREAD_GRAYSCALE, IMREAD_COLOR 。
下面从刚才保存的txt文件中读取图像数据流,然后将数据流解码为图像显示(要把读取的数据流转换为ndarray格式再进行解码)。
import cv2 #图像解码 import numpy as np with open('imencode.txt','rb') as f: #以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 data_encode = f.read() #从文件中读取图像数据 img_array = np.frombuffer(data_encode,dtype=np.uint8) # 把读取的数据流转换为ndarray(数组)格式 img_decode = cv2.imdecode(img_array,cv2.IMREAD_COLOR) #图像解码 cv2.imshow('img_decode',img_decode) cv2.waitKey(0) cv2.destroyAllWindows()