OpenCV库框架结构
在上文已经学习过了opencv的编码规则,为了能够方便灵活的运用OPECV库,我们需要对其框架结构进行学习了解,以方便我们进行实际工程调用调用。
1、Opnecv库到底提供了什么?
打开opencv源码安装的文件夹E:\opencv\opencv
可以看到上述文件,很明显,Opencv解压后,提供给我们一个编译环境及工程的源码环境以及使用的LICENSE。
2、Opencv库build文件夹说明
打开build文件夹,可以看到如下文件:
其他的文件夹都是一些编译工具文件及兼容文件,这里重点需要关注的是include文件夹,其内包含的就是库文件包含的模块文件,进入到include文件,可以看到两个文件夹,如下所示:
这里的opencv包含的是C接口,opencv2包含的是C++接口。
3、C接口包含的模块
进入到opencv,可以看到如下文件,
这里C接口下的模块功能说明如下:
- CV:主要的OPENCV函数
- CVAUX:辅助(实验性的)的OpenCV函数
- CXCORE: 数据结构与线性代数支持。
- HIGHGUI:图像界面函数。
- ML:机器学习,包括模式分类和回归分析等。
- CXEIGEN:图形变换接口。
- CXMISC:跨平台通信的接口模块。
4、C++接口包含的模块
进入opencv2可以看到其下又有如下文件:
这里对C++接口调用的模块进行说明:
- calib3d - 相机标定以及三维重建。相机标定用于去除相机自身缺陷导致的画面形变,还原真实的场景,确保计算的准确性。三维重建通常用在双目视觉(立体视觉),即两个标定后的摄像头观察同一个场景,通过计算两幅画面中的相关性来估算像素的深度。
- core - 一个定义基本数据结构的紧凑模块,包括密集的多维数组
Mat
和所有其他模块使用的基本功能。 - dnn - 深度学习相关的模块,该模块的功能仅适用于正向传递计算(即网络测试)。原则上不支持网络培训。
- features2d - 包含 2D 特征值检测的框架。包含各种特征值检测器及描述子,例如 FAST、MSER、OBRB、BRISK等。各类特征值拥有统一的算法接口,因此在不影响程序逻辑的情况下可以进行替换。
- flann-最近邻开源库,用于在多维空间内聚类及搜索的近似算法,做图像检索的读者对它不会陌生。
- highgui - 一个易于使用的视频捕获,图像和视频编解码器界面,以及简单的UI功能。高级图形界面及与 QT 框架的整合。
- imgcodecs - 一个用于读写图像的易用接口,负责各种格式的图片的读写,这个模块是从以前的 highgui 中剥离的。
- imgproc - 一个图像处理模块,包括线性和非线性图像过滤,几何图像变换(调整大小,仿射和透视变形,基于通用表的重新映射),颜色空间转换,直方图等。
- ml- 机器学习相关模块,包括统计模型、K最近邻、支持向量机、决策树、神经网络等经典的机器学习算法。
- objdetect - 检测预定义类的对象和实例(例如,面部,眼睛,马克杯,人,汽车等)。物体检测模块。包括haar分类器、SVM检测器及文字检测。
- photo-包含计算摄影学, 包括图像修补、去噪、HDR成像、非真实感渲染等。如果想实现Photoshop的高级功能,那么这个模块必不可少。
- shape-形状距离和匹配。用于描述形状、比较形状。
- stitching-用于图像拼接,可用于制作全景图。
- superres-超分辨率,用于增强图像的分辨率。
- video- 视频分析模块,包括运动估计,背景减法和对象跟踪算法。视频分析模块。包括背景提取、光流跟踪、卡尔曼滤波等,做视频监控的读者会经常使用这个模块。
- videoio-对于视频捕获和视频编码器是一个易用的接口。负责视频文件的读写,也包括摄像头、Kinect 等的输入。
- videostab-视频稳定,用于解决相机移动时拍摄的视频不够稳定的问题。
- gpu - 来自不同OpenCV模块的GPU加速算法。
5、Opencv库source源码文件夹
打开opencv下的source文件夹,可以看到如下文件:
3rdparty/,包含第三方的库,比如视频解码用的 ffmpeg,jpg、png、tiff等图片的开源解码库。
apps/,包含进行 haar 分类器训练的工具,opencv 进行人脸检测便是基于 haar 分类器。如果你想检测人脸以外的图片,千万不要错过这几个工具。
cmake/,包含生成工程项目时 cmake 的依赖文件,用于智能搜索第三方库,普通开发者不需要关心这个文件夹的内容。
data/,包含 opencv 库以及范例中用到的资源文件,haar 物体检测的分类器位于haarcascades子文件中。
doc/,包含生成文档所需的源文件以及辅助脚本。
include/,包含入口头文件。opencv 子文件夹中是 C 语言风格的API,也就是《Learning OpenCV (第一版)》中描述的API函数,官方将逐渐淘汰 C 风格函数,因此我不推荐大家使用该文件夹中的头文件。opencv2 子文件中只有一个 opencv.hpp 文件,这是 cv2 以及 cv3 推荐使用的头文件。
modules/,包含核心代码,opencv 真正的代码都在这个文件夹中。opencv 从2.0开始以模块的方式组织各种功能,近两年模块的数量增长得很快,后面我会依次介绍每个模块的作用。
platforms/,包含交叉编译所需的工具链以及额外的代码,交叉编译指的是在一个操作系统中编译供另一个系统使用的文件。
samples/,范例文件夹,包含大量学习案例。
6、modules模块源码
进入modules文件夹可以看到其下包含如下文件夹:
与build下的include相比,这里源码多了:
viz:三维可视化模块。可以认为这个模块实现了一个简单的三维可视化引擎,有各种UI控件和键盘、鼠标交互方式。底层实现基于 VTK 这个第三方库。
cuda/,CUDA-加速的计算机视觉算法,包括数据结构 cuda::GpuMat、 基于cuda的相机标定及三维重建等。
cudaarithm/,CUDA-加速的矩阵运算模块。
cudabgsegm/,CUDA-加速的背景分割模块,通常用于视频监控。
cudacodec/,CUDA-加速的视频编码与解码。
cudafeatures2d/,CUDA-加速的特征检测与描述模块,与features2d/模块功能类似。
cudafilters/,CUDA-加速的图像滤波。
cudaimgproc/,CUDA-加速的图像处理算法,包含直方图计算、霍夫变换等。
cudaoptflow/,CUDA-加速的光流检测算法。
cudastereo/,CUDA-加速的立体视觉匹配算法。
cudawarping/,实现了 CUDA-加速的快速图像变换,包括透视变换、旋转、改变尺寸等。
cudaev/,实现 CUDA 版本的核心功能,类似 core/ 模块中的基础算法。