opencv数据容器Mat,cvMat和IplImage
opencv中常见的与图像操作有关的数据容器有Mat,cvMat和IplImage,这三种类型都可以代表和显示图像,但是,Mat类型侧重于计算,数学性较高,openCV对Mat类型的计算也进行了优化。而CvMat和IplImage类型更侧重于“图像”,opencv对其中的图像操作(缩放、单通道提取、图像阈值操作等)进行了优化。在opencv2.0之前,opencv是完全用C实现的,但是,IplImage类型与CvMat类型的关系类似于面向对象中的继承关系。实际上,CvMat之上还有一个更抽象的基类----CvArr,这在源代码中会常见。
1. IplImage
opencv中的图像信息头,该结构体定义:
1 typedef struct _IplImage 2 { 3 int nSize; 4 int ID; 5 int nChannels; 6 int alphaChannel; 7 int depth; 8 9 char colorModel[4]; 10 char channelSeq[4]; 11 int dataOrder; 12 int origin; 13 int align; 14 15 int width; 16 int height; 17 18 struct _IplROI *roi; 19 struct _IplImage *maskROI; 20 void *imageId; 21 struct _IplTileInfo *tileInfo; 22 23 int imageSize; 24 char *imageData; 25 int widthStep; 26 int BorderMode[4]; 27 int BorderConst[4]; 28 29 char *imageDataOrigin; 30 } IplImage;
dataOrder中的两个取值:交叉存取颜色通道是颜色数据排列将会是BGRBGR...的交错排列。分开的颜色通道是有几个颜色通道就分几个颜色平面存储。roi是IplROI结构体,该结构体包含了xOffset,yOffset,height,width,coi成员变量,其中xOffset,yOffset是x,y坐标,coi代表channel of interest(感兴趣的通道),非0的时候才有效。访问图像中的数据元素,分间接存储和直接存储,当图像元素为浮点型时,(uchar *) 改为 (float *):
1 IplImage* img=cvLoadImage("lena.jpg", 1); 2 CvScalar s; 3 s=cvGet2D(img,i,j); 4 cvSet2D(img,i,j,s); 5 6 7 IplImage* img; //malloc memory by cvLoadImage or cvCreateImage 8 for(int row = 0; row < img->height; row++) 9 { 10 for (int col = 0; col < img->width; col++) 11 { 12 b = CV_IMAGE_ELEM(img, UCHAR, row, col * img->nChannels + 0); 13 g = CV_IMAGE_ELEM(img, UCHAR, row, col * img->nChannels + 1); 14 r = CV_IMAGE_ELEM(img, UCHAR, row, col * img->nChannels + 2); 15 } 16 } 17 18 19 IplImage* img; //malloc memory by cvLoadImage or cvCreateImage 20 uchar b, g, r; // 3 channels 21 for(int row = 0; row < img->height; row++) 22 { 23 for (int col = 0; col < img->width; col++) 24 { 25 b = ((uchar *)(img->imageData + row * img->widthStep))[col * img->nChannels + 0]; 26 g = ((uchar *)(img->imageData + row * img->widthStep))[col * img->nChannels + 1]; 27 r = ((uchar *)(img->imageData + row * img->widthStep))[col * img->nChannels + 2]; 28 } 29 }
初始化使用IplImage *,是一个指向结构体IplImage的指针:
1 IplImage * cvLoadImage(const char * filename, int iscolor CV_DEFAULT(CV_LOAD_IMAGE_COLOR)); //load images from specified image 2 IplImage * cvCreateImage(CvSize size, int depth, int channels); //allocate memory
2.CvMat
首先,我们需要知道,第一,在OpenCV中没有向量(vector)结构。任何时候需要向量,都只需要一个列矩阵(如果需要一个转置或者共轭向量,则需要一个行矩阵)。第二,OpenCV矩阵的概念与我们在线性代数课上学习的概念相比,更抽象,尤其是矩阵的元素,并非只能取简单的数值类型,可以是多通道的值。CvMat 的结构:
1 typedef struct CvMat 2 { 3 int type; 4 int step; 5 int* refcount; 6 union { 7 uchar* ptr; 8 short* s; 9 int* i; 10 float* fl; 11 double* db; 12 } data; 13 union { 14 int rows; 15 int height; 16 }; 17 union { 18 int cols; 19 int width; 20 }; 21 } CvMat;
创建CvMat数据:
1 CvMat * cvCreateMat(int rows, int cols, int type); 2 CV_INLine CvMat cvMat((int rows, int cols, int type, void* data CV_DEFAULT); 3 CvMat * cvInitMatHeader(CvMat * mat, int rows, int cols, int type, void * data CV_DEFAULT(NULL), int step CV_DEFAULT(CV_AUTOSTEP));
对矩阵数据进行访问:
1 cvmSet( CvMat* mat, int row, int col, double value); 2 cvmGet( const CvMat* mat, int row, int col ); 3 4 5 CvScalar cvGet2D(const CvArr * arr, int idx0, int idx1); //CvArr只作为函数的形参void cvSet2D(CvArr* arr, int idx0, int idx1, CvScalar value); 6 7 8 CvMat * cvmat = cvCreateMat(4, 4, CV_32FC1); 9 cvmat->data.fl[row * cvmat->cols + col] = (float)3.0; 10 11 12 CvMat * cvmat = cvCreateMat(4, 4, CV_64FC1); 13 cvmat->data.db[row * cvmat->cols + col] = 3.0; 14 CvMat * cvmat = cvCreateMat(4, 4, CV_64FC1); 15 CV_MAT_ELEM(*cvmat, double, row, col) = 3.0; 16 if (CV_MAT_DEPTH(cvmat->type) == CV_32F) 17 CV_MAT_ELEM_CN(*cvmat, float, row, col * CV_MAT_CN(cvmat->type) + ch) = (float)3.0; // ch为通道值 18 if (CV_MAT_DEPTH(cvmat->type) == CV_64F) 19 CV_MAT_ELEM_CN(*cvmat, double, row, col * CV_MAT_CN(cvmat->type) + ch) = 3.0; // ch为通道值 20 21 22 for (int row = 0; row < cvmat->rows; row++) 23 { 24 p = cvmat ->data.fl + row * (cvmat->step / 4); 25 for (int col = 0; col < cvmat->cols; col++) 26 { 27 *p = (float) row + col; 28 *(p+1) = (float)row + col + 1; 29 *(p+2) = (float)row + col + 2; 30 p += 3; 31 } 32 } 33 34 CvMat * vector = cvCreateMat(1,3, CV_32SC2);CV_MAT_ELEM(*vector, CvPoint, 0, 0) = cvPoint(100,100); 35 36 CvMat * vector = cvCreateMat(1,3, CV_64FC4);CV_MAT_ELEM(*vector, CvScalar, 0, 0) = CvScalar(0, 0, 0, 0);
复制矩阵操作:
1 CvMat* M1 = cvCreateMat(4,4,CV_32FC1); 2 CvMat* M2; 3 M2=cvCloneMat(M1);
Mat是opencv2.0推出的处理图像的新的数据结构,现在越来越有趋势取代之前的cvMat和lplImage,相比之下Mat最大的好处就是能够更加方便的进行内存管理,不再需要程序员手动管理内存的释放。opencv2.3中提到Mat是一个多维的密集数据数组,可以用来处理向量和矩阵、图像、直方图等等常见的多维数据。
1 class CV_EXPORTS Mat 2 { 3 4 public: 5 6 7 8 9 int flags;(Note :目前还不知道flags做什么用的) 10 int dims; 11 int rows,cols; 12 uchar *data; 13 int * refcount; 14 ... 15 16 };
从以上结构体可以看出Mat也是一个矩阵头,默认不分配内存,只是指向一块内存(注意读写保护)。初始化使用create函数或者Mat构造函数,以下整理自opencv2.3.1 Manual:
1 Mat(nrows, ncols, type, fillValue]); 2 M.create(nrows, ncols, type);
例子:
1 Mat M(7,7,CV_32FC2,Scalar(1,3)); 2 M.create(100, 60, CV_8UC(15)); 3 int sz[] = {100, 100, 100}; 4 Mat bigCube(3, sz, CV_8U, Scalar:all(0)); 5 double m[3][3] = {{a, b, c}, {d, e, f}, {g, h, i}}; 6 Mat M = Mat(3, 3, CV_64F, m).inv(); 7 Mat img(Size(320,240),CV_8UC3); 8 Mat img(height, width, CV_8UC3, pixels, step); 9 IplImage* img = cvLoadImage("greatwave.jpg", 1); 10 Mat mtx(img,0); // convert IplImage* -> Mat;
访问Mat的数据元素:
1 Mat M; 2 M.row(3) = M.row(3) + M.row(5) * 3; 3 4 5 Mat M1 = M.col(1); 6 M.col(7).copyTo(M1); 7 8 9 Mat M; 10 M.at<double>(i,j); 11 M.at(uchar)(i,j); 12 Vec3i bgr1 = M.at(Vec3b)(i,j) 13 Vec3s bgr2 = M.at(Vec3s)(i,j) 14 Vec3w bgr3 = M.at(Vec3w)(i,j) 15 16 17 double sum = 0.0f; 18 for(int row = 0; row < M.rows; row++) 19 { 20 const double * Mi = M.ptr<double>(row); 21 for (int col = 0; col < M.cols; col++) 22 sum += std::max(Mi[j], 0.); 23 } 24 25 26 double sum=0; 27 MatConstIterator<double> it = M.begin<double>(), it_end = M.end<double>(); 28 for(; it != it_end; ++it) 29 sum += std::max(*it, 0.);
Mat可进行Matlab风格的矩阵操作,如初始化的时候可以用initializers,zeros(), ones(), eye(). 除以上内容之外,Mat还有有3个重要的方法:
1 Mat mat = imread(const String* filename); // 读取图像 2 imshow(const string frameName, InputArray mat); // 显示图像 3 imwrite (const string& filename, InputArray img); //储存图像
1 CvMat matheader; 2 CvMat * mat = cvGetMat(img, &matheader); 3 4 CvMat * mat = cvCreateMat(img->height, img->width, CV_64FC3); 5 cvConvert(img, mat)
IplImage -> Mat
Mat::Mat(const IplImage* img, bool copyData=false);
Mat -> IplImage Mat M IplImage iplimage = M;
CvMat -> Mat Mat::Mat(const CvMat* m, bool copyData=false);
Mat -> CvMat 例子(假设Mat类型的imgMat图像数据存在): CvMat cvMat = imgMat;/*Mat -> CvMat, 类似转换到IplImage,不复制数据只创建矩阵头
在openCV中,Mat是一个多维的密集数据数组。可以用来处理向量和矩阵、图像、直方图等等常见的多维数据。
Mat有3个重要的方法:
1、Mat mat = imread(constString*filename); 读取图像
2、imshow(const string frameName,InputArraymat); 显示图像
3、imwrite (const string&filename,InputArray img); 储存图像
Mat类型较CvMat与IplImage类型来说,有更强的矩阵运算能力,支持常见的矩阵运算。在计算密集型的应用当中,将CvMat与IplImage类型转化为Mat类型将大大减少计算时间花费。
A.Mat -> IplImage
同样只是创建图像头,而没有复制数据。
例: // 假设Mat类型的imgMat图像数据存在
IplImage pImg= IplImage(imgMat);
B.Mat -> CvMat
与IplImage的转换类似,不复制数据,只创建矩阵头。
例: // 假设Mat类型的imgMat图像数据存在
CvMat cvMat = imgMat;
二、CvMat类型与IplImage类型:“图像”类型
在openCV中,Mat类型与CvMat和IplImage类型都可以代表和显示图像,但是,Mat类型侧重于计算,数学性较高,openCV对Mat类型的计算也进行了优化。而CvMat和IplImage类型更侧重于“图像”,openCV对其中的图像操作(缩放、单通道提取、图像阈值操作等)进行了优化。
补充:IplImage由CvMat派生,而CvMat由CvArr派生即CvArr->CvMat -> IplImage
CvArr用作函数的参数,无论传入的是CvMat或IplImage,内部都是按CvMat处理。
1.CvMat
A.CvMat-> IplImage
IplImage* img = cvCreateImage(cvGetSize(mat),8,1);
cvGetImage(matI,img);
cvSaveImage("rice1.bmp",img);
B.CvMat->Mat
与IplImage的转换类似,可以选择是否复制数据。
Mat::Mat(const CvMat* m, bool copyData=false);
在openCV中,没有向量(vector)的数据结构。任何时候,但我们要表示向量时,用矩阵数据表示即可。
但是,CvMat类型与我们在线性代数课程上学的向量概念相比,更抽象,比如CvMat的元素数据类型并不仅限于基础数据类型,比如,下面创建一个二维数据矩阵:
CvMat* cvCreatMat(int rows ,int cols , int type);
这里的type可以是任意的预定义数据类型,比如RGB或者别的多通道数据。这样我们便可以在一个CvMat矩阵上表示丰富多彩的图像了。
2.IplImage
在类型关系上,我们可以说IplImage类型继承自CvMat类型,当然还包括其他的变量将之解析成图像数据。
IplImage类型较之CvMat多了很多参数,比如depth和nChannels。在普通的矩阵类型当中,通常深度和通道数被同时表示,如用32位表示RGB+Alpha.但是,在图像处理中,我们往往将深度与通道数分开处理,这样做是OpenCV对图像表示的一种优化方案。
IplImage的对图像的另一种优化是变量origin----原点。在计算机视觉处理上,一个重要的不便是对原点的定义不清楚,图像来源,编码格式,甚至操作系统都会对原地的选取产生影响。为了弥补这一点,openCV允许用户定义自己的原点设置。取值0表示原点位于图片左上角,1表示左下角。
dataOrder参数定义数据的格式。有IPL_DATA_ORDER_PIXEL和IPL_DATA_ORDER_PLANE两种取值,前者便是对于像素,不同的通道的数据交叉排列,后者表示所有通道按顺序平行排列。
IplImage类型的所有额外变量都是对“图像”的表示与计算能力的优化。
A.IplImage -> Mat
IplImage* pImg = cvLoadImage("lena.jpg");
Mat img(pImg,0); // 0是不複製影像,也就是pImg與img的data共用同個記憶體位置,header各自有
B.IplImage -> CvMat
法1:CvMatmathdr,*mat = cvGetMat( img, &mathdr );
法2:CvMat *mat = cvCreateMat(img->height,img->width, CV_64FC3 );
cvConvert( img, mat );
C.IplImage*-> BYTE*
BYTE* data= img->imageData;
CvMat和IplImage创建时的一个小区别:
1、建立矩阵时,第一个参数为行数,第二个参数为列数。
CvMat* cvCreateMat( int rows, int cols, int type );
2、建立图像时,CvSize第一个参数为宽度,即列数;第二个参数为高度,即行数。这 个和CvMat矩阵正好相反。
IplImage* cvCreateImage(CvSize size, int depth, int channels );
CvSize cvSize( int width, int height );
IplImage内部buffer每行是按4字节对齐的,CvMat没有这个限制
补充:
A.BYTE*-> IplImage*
img= cvCreateImageHeader(cvSize(width,height),depth,channels);
cvSetData(img,data,step);
//首先由cvCreateImageHeader()创建IplImage图像头,制定图像的尺寸,深度和通道数;
//然后由cvSetData()根据BYTE*图像数据指针设置IplImage图像头的数据数据,
//其中step指定该IplImage图像每行占的字节数,对于1通道的IPL_DEPTH_8U图像,step可以等于width。