OpenCV 图像处理
1、图像相关知识
1.1、模拟图像和数字图像
模拟图像又称连续图像,它通过某种物理量(如光、电等)的强弱变化来记录图像亮度信息,所以是连续变换的,容易受干扰。
数字图像亮度用离散数值表示。
1.2、数字图像的表示
计算机采用0/1编码的系统,数字图像也是利用0/1来记录信息,我们平常接触的图像都是8位数图像,包含0~255灰度,其中0,代表最黑,1,表示最白。
1.3、数字图像分类
二值图像:
二值图像是指在图像中,灰度等级只有两种,也就是说,图像中的任何像素点的灰度值均为0或者255,分别代表黑色和白色。
灰度图像:
在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。一般常用的是加权平均法来获取每个像素点的灰度值。
Gamma校正:人眼对亮度的感知和物理功率不成正比,而是幂函数的关系,这个函数的指数通常为2.2,称为Gamma值。
打个比方,功率为50%的灰色,人眼实际感知亮度为0.51/2.2X100%=72.97%;
而人眼认为的50%中灰色,实际功率为0.52.2X100%=21.76%。
所以RGB中的灰度值,为了考虑到较小的存储范围(0~255)和较平衡的亮暗部比例,所以需要进行Gamma校正,而不是直接对应功率值,因此RGB值RGB颜色值不能简单直接相加,而是必须用2.2次方换算成物理光功率后才能进行下一步计算。
Gamma校正算法:
2、OpenCV简介
OpenCV基于C++实现,同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API,结合了OpenCV C++ API和Python语言的最佳特性。可以在不同的系统平台上使用,包括Windows,Linux,OS X,Android和iOS。
2.1、OpenCV-Python
OpenCV-Python是原始OpenCV C++实现的Python包装器。使用Python包装器使得代码编写更为容易且拥有和C++相同的运行速度。
OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库,具有MATLAB风格的语法。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
2.2、OpenCV中的模块
其中core、highgui、imgproc是最基础的模块:
- core模块:实现了最核心的数据结构及其基本运算,如绘图函数、数组操作相关函数等;
- highgui模块:实现了视频与图像的读取、显示、存储等接口;
- imgproc模块:实现了图像处理的基础方法,包括图像滤波、图像的几何变换、平滑、阈值分割、形态学处理、边缘检测、目标检测、运动分析和对象跟踪等。
对于图像处理其他更高层次的方向及应用,OpenCV也有相关的模块实现:
- features2d模块:用于提取图像特征以及特征匹配,nonfree模块实现了一些专利算法,如sift特征;
- objdetect模块:实现了一些目标检测的功能,经典的基于Haar、LBP特征的人脸检测,基于HOG的行人、汽车等目标检测,分类器使用Cascade Classification(级联分类)和Latent SVM等;
- stitching模块:实现了图像拼接功能;
- FLANN模块:(Fast Library for Approximate Nearest Neighbors),包含快速近似最近邻搜索FLANN 和聚类Clustering算法;
- ml模块机器学习模块:(SVM,决策树,Boosting等等);
- photo模块:包含图像修复和图像去噪两部分;
- video模块:针对视频处理,如背景分离,前景检测、对象跟踪等;
- calib3d模块:即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等;
- G-API模块:包含超高效的图像处理pipeline引擎
在接下来详细介绍OpenCV的objdetect模块在C++中的使用。