Python-OpenCV学习（一）：OpenCV结构

转载请注明出处：danscarlett的博客园 

OpenCV是计算机视觉领域应用最广泛的开源工具包，基于C/C++，支持Linux/Windows/MacOS/Android/iOS，并提供了Python，Matlab和Java等语言的接口。2010年OpenCV发布了2.0版本，添加了非常完备的C++接口，从2.0开始的版本非常用户非常庞大，至今仍在维护和更新。2015年OpenCV 3正式发布，除了架构的调整，还加入了更多算法，更多性能的优化和更加简洁的API，另外也加强了对GPU的支持，现在已经在许多研究机构和商业公司中应用开来。相比OpenCV2，OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性，以及上手安装的难度，这部分先以2为主进行介绍。

根据功能和需求的不同，OpenCV中的函数接口大体可以分为如下部分：

core：核心模块，主要包含了OpenCV中最基本的结构（矩阵，点线和形状等），以及相关的基础运算/操作。
imgproc：图像处理模块，包含和图像相关的基础功能（滤波，梯度，改变大小等），以及一些衍生的高级功能（图像分割，直方图，形态分析和边缘/直线提取等）。
highgui：提供了用户界面和文件读取的基本函数，比如图像显示窗口的生成和控制，图像/视频文件的IO等。

　　针对视频和一些特别的视觉应用，OpenCV也提供了强劲的支持：

- video：用于视频分析的常用功能，比如光流法（Optical Flow）和目标跟踪等。
- calib3d：三维重建，立体视觉和相机标定等的相关功能。
- features2d：二维特征相关的功能，主要是一些不受专利保护的，商业友好的特征点检测和匹配等功能，比如ORB特征。
- object：目标检测模块，包含级联分类和Latent SVM
- ml：机器学习算法模块，包含一些视觉中最常用的传统机器学习算法。
- flann：最近邻算法库，Fast Library for Approximate Nearest Neighbors，用于在多维空间进行聚类和检索，经常和关键点匹配搭配使用。
- gpu：包含了一些gpu加速的接口，底层的加速是CUDA实现。
- photo：计算摄像学（Computational Photography）相关的接口，当然这只是个名字，其实只有图像修复和降噪而已。
- stitching：图像拼接模块，有了它可以自己生成全景照片。
- nonfree：受到专利保护的一些算法，其实就是SIFT和SURF。
- contrib：一些实验性质的算法，考虑在未来版本中加入的。
- legacy：字面是遗产，意思就是废弃的一些接口，保留是考虑到向下兼容。
- ocl：利用OpenCL并行加速的一些接口。
- superres：超分辨率模块，其实就是BTV-L1（Biliteral Total Variation – L1 regularization）算法
- viz：基础的3D渲染模块，其实底层就是著名的3D工具包VTK（Visualization Toolkit）。

 参考资料：
《给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV》

posted @ 2017-07-12 15:37 danscarlett 阅读(1773) 评论(0) 编辑收藏举报

刷新页面返回顶部

danscarlett的园子

学而不思则罔，思而不学则殆。

Python-OpenCV学习（一）：OpenCV结构

公告