Python处理数据方向之OpenCV
简介
OpenCV是用于快速处理图像处理、计算机视觉问题的工具,这是一款由Intel公司俄罗斯团队发起并参与和维护的一个计算机视觉处理开源软件库,现在支持大量与计算机视觉和机器学习相关的众多相关算法,并且正在不断扩展。
OpenCV于1999年由英特尔的Gary Bradsky创立,第一个版本于2000年发布。
Vadim Pisarevsky加入了Gary Bradsky,管理英特尔的俄罗斯软件OpenCV团队。
2005年,OpenCV被用于斯坦利,它赢得了2005年DARPA Grand Challenge。
后来,它在Willow Garage的支持下继续积极发展,由Gary Bradsky和Vadim Pisarevsky领导该项目。
OpenCV支持多种编程语言进行开发如如c++、Python、Java等,可在不同的平台上使用,包括Windows、Linux、OS X、Android和iOS。
基于CUDA和OpenCL的高速GPU操作接口也在积极开发中。
OpenCV-Python
OpenCV-Python是一个Python绑定库,旨在解决计算机视觉问题。
Python是一种由Guido van Rossum开发的通用编程语言,它很快就变得非常流行,主要是因为它的简单性和代码可读性。它使程序员能够在不降低可读性的情况下用更少的代码行表达思想。
与C / C++等语言相比,Python速度较慢。也就是说,Python可以使用C / C++轻松扩展,这允许我们可以在C / C++中编写计算密集型代码,并创建可用作Python模块的Python包装器。
这给我们带来了两个好处:首先,代码与原始C / C++代码一样快(因为它是在后台工作的实际C++代码),其次,在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。
OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库,具有MATLAB风格的语法。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
快速上手
基础安装:
安装OpenCV之前需要先安装numpy, matplotlib。
先安装OpenCV-Python, 由于一些经典的算法被申请了版权,新版本有很大的限制,所以选用3.4.3以下的版本
pip install opencv-python==3.4.2.17
测试:
运行以下代码无误表示安装成功
import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)
如果我们要利用SIFT和SURF等进行特征提取时,还需要安装:
pip install opencv-contrib-python==3.4.2.17
python中安装OpenCV提供四种依赖包
标准桌面环境(Windows、MacOS、几乎所有GNU/Linux发行版)
如果只需要主模块
pip install opencv-python
如果只需要主模块和contrib 模块
pip install opencv-contrib-python
用于服务器环境的软件包
这些包不包含任何gui功能。它们体积较小,适用于更受限制的环境
如果只需要主模块(无GUI)
pip install opencv-python-headless
如果只需要主模块和contrib 模块(无GUI)
pip install opencv-contrib-python-headless
参考:https://www.cnpython.com/pypi/opencv-python-headless
使用国内镜像下载更快:
pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
注意:这四个不同的软件包,你应该只选择其中一个。不要在同一环境中安装多个不同的软件包。如果您在同一环境中安装了多个不同的软件包,请使用pip uninstall将它们全部卸载,然后只重新安装一个软件包。
Opencv 模块
其中core、highgui、imgproc是最基础的模块,该课程主要是围绕这几个模块展开的,分别介绍如下:
- core模块实现了最核心的数据结构及其基本运算,如绘图函数、数组操作相关函数等。
- highgui模块实现了视频与图像的读取、显示、存储等接口。
- imgproc模块实现了图像处理的基础方法,包括图像滤波、图像的几何变换、平滑、阈值分割、形态学处理、边缘检测、目标检测、运动分析和对象跟踪等。
对于图像处理其他更高层次的方向及应用,OpenCV也有相关的模块实现
- features2d模块用于提取图像特征以及特征匹配,nonfree模块实现了一些专利算法,如sift特征。
- objdetect模块实现了一些目标检测的功能,经典的基于Haar、LBP特征的人脸检测,基于HOG的行人、汽车等目标检测,分类器使用Cascade Classification(级联分类)和Latent SVM等。
- stitching模块实现了图像拼接功能。
- FLANN模块(Fast Library for Approximate Nearest Neighbors),包含快速近似最近邻搜索FLANN 和聚类Clustering算法。
- ml模块机器学习模块(SVM,决策树,Boosting等等)。
- photo模块包含图像修复和图像去噪两部分。
- video模块针对视频处理,如背景分离,前景检测、对象跟踪等。
- calib3d模块即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
- G-API模块包含超高效的图像处理pipeline引擎。
opencv-python读取、展示和存储图像
1、imread函数
imread函数读取数字图像,先看一下官网对于该函数的定义
cv2.imread(path_of_image, intflag)
函数参数一: 需要读入图像的完整的路径
函数参数二: 标志以什么形式读入图像,可以选择一下方式:
-
cv2.IMREAD_COLOR: 加载彩色图像。任何图像的透明度都将被忽略。它是默认标志
-
cv2.IMREAD_GRAYSCALE:以灰度模式加载图像
-
cv2.IMREAD_UNCHANGED:保留读取图片原有的颜色通道
-
1 :等同于cv2.IMREAD_COLOR
-
0 :等同于cv2.IMREAD_GRAYSCALE
-
-1 :等同于cv2.IMREAD_UNCHANGED
来个示例更清楚:
import numpy as np
import cv2
gray_img = cv2.imread('img/cartoon.jpg', 0) #加载灰度图像
rgb_img = cv2.imread('img/cartoon.jpg', 1) #加载RGB彩色图像
2、imshow函数
imshow函数作用是在窗口中显示图像,窗口自动适合于图像大小,我们也可以通过imutils模块调整显示图像的窗口的大小。函数官方定义如下:
cv2.imshow(windows_name, image)
函数参数一: 窗口名称(字符串)
函数参数二: 图像对象,类型是numpy中的ndarray类型,注:这里可以通过imutils模块改变图像显示大小,下面示例展示
上示例:
cv2.imshow('origin image', rgb_img) #显示原图
cv2.imshow('origin image', imutils.resize(rgb_img, 800)) #利用imutils模块调整显示图像大小
cv2.imshow('gray image', imutils.resize(gray_img, 800))
if cv2.waitKey(0) == 27:
cv2.destroyAllWindows()
3、imwrite函数
imwrite函数检图像保存到本地,官方定义:
cv2.imwrite(image_filename, image)
函数参数一: 保存的图像名称(字符串)
函数参数二: 图像对象,类型是numpy中的ndarray类型
- cv2.imwrite(‘rgb_img.jpg’, rgb_img) #将图像保存成jpg文件
- cv2.imwrite(‘gray_img.png’, gray_img) #将图像保存成png文件
4、窗口销毁函数
当我们使用imshow函数展示图像时,最后需要在程序中对图像展示窗口进行销毁,否则程序将无法正常终止,常用的销毁窗口的函数有下面两个:
销毁单个特定窗口
cv2.destroyWindow(windows_name) #销毁单个特定窗口
参数: 将要销毁的窗口的名字
销毁全部窗口,无参数
cv2.destroyAllWindows() #销毁全部窗口,无参数
那我们合适销毁窗口,肯定不能图片窗口一出现我们就将窗口销毁,这样便没法观看窗口,试想有两种方式:
(1) 让窗口停留一段时间然后自动销毁;
(2) 接收指定的命令,如接收指定的键盘敲击然后结束我们想要结束的窗口
以上两种情况都将使用cv2.waitKey函数, 首先产看函数定义:
cv2.waitKey(time_of_milliseconds)
唯一参数 time_of_milliseconds是整数,可正可负也可是零,含义和操作也不同,分别对应上面说的两种情况
(1) time_of_milliseconds > 0 :此时time_of_milliseconds表示时间,单位是毫秒,含义表示等待 time_of_milliseconds毫秒后图像将自动销毁,看以下示例
#表示等待10秒后,将销毁所有图像
if cv2.waitKey(10000):
cv2.destroyAllWindows()
#表示等待10秒,将销毁窗口名称为'origin image'的图像窗口
if cv2.waitKey(10000):
cv2.destroyWindow('origin image')
(2) time_of_milliseconds <= 0 : 此时图像窗口将等待一个键盘敲击,接收到指定的键盘敲击便会进行窗口销毁。我们可以自定义等待敲击的键盘,通过下面的例子进行更好的解释
#当指定waitKey(0) == 27时当敲击键盘 Esc 时便销毁所有窗口
if cv2.waitKey(0) == 27:
cv2.destroyAllWindows()
#当接收到键盘敲击A时,便销毁名称为'origin image'的图像窗口
if cv2.waitKey(-1) == ord('A'):
cv2.destroyWindow('origin image')
下面给出一个完整读取、展示、保存和图像销毁示例:
import cv2
import imutils
import numpy as np
rgb_img = cv2.imread('E:/peking_rw/ocr_project/base_prehandle/img/cartoon.jpg')
gray_img = cv2.cvtColor(rgb_img, cv2.COLOR_BGR2GRAY)
cv2.imshow('origin image', imutils.resize(rgb_img, 800))
cv2.imshow('gray image', imutils.resize(gray_img, 800))
cv2.imwrite('rgb_img.jpg', rgb_img)
cv2.imwrite('gray_img.png', gray_img)
#等待一定时间自动销毁图像窗口
#if cv2.waitKey(10000):
# cv2.destroyAllWindows()
#if cv2.waitKey(10000):
# cv2.destroyWindow('origin image')
#接收特定键盘销毁图像窗口
#if cv2.waitKey(-1) == ord('A'):
# cv2.destroyWindow('origin image')
if cv2.waitKey(0) ==![在这里插入图片描述](https://img-blog.csdnimg.cn/965a084d8ebc4740b3181caf4b45284f.jpeg#pic_center)
27:
cv2.destroyAllWindows()
原图展示在本文开头展示,灰度图像如下所示:
图像色彩空间变换函数cv2.cvtColor
友情链接:
opencv-python学习笔记(一)—— opencv介绍
【强烈推荐】Opencv-python介绍
【数字图像处理系列】opencv-python快速入门篇
超详细OpenCV之python操作
Python+OpenCV计算机视觉全面基础概述(上篇)