[双目视差] 立体校正源码分析(opencv)

目录
[双目视差] 立体校正源码分析(opencv)
一、源码解析
 二、源码中的方法

文章目录

[双目视差] 立体校正源码分析(opencv)
- 一、源码解析
- 二、源码中的方法

[双目视差] 立体校正源码分析(opencv)

一、源码解析

立体校正：把实际中非共面行对准的两幅图像，校正成共面行对准
stereoRectify(cameraMatrixL, distCoeffL, cameraMatrixR, distCoeffR, imageSize, R, T, Rl, Rr, Pl, Pr, Q, CALIB_ZERO_DISPARITY,0, imageSize, &validROIL, &validROIR);
为每个摄像头计算立体校正的映射矩阵。所以其运行结果并不是直接将图片进行立体矫正，而是得出进行立体矫正所需要的映射矩阵。
立体矫正前：

立体矫正后：

过程：
(1)共面：先把旋转矩阵变为旋转向量，对旋转向量的模长平分，这样使两个图像平面共面，此时行未对齐。

cvConvert(matR, &om);
cvConvertScale(&om, &om, -0.5);

(2)行对准：建立行对准换行矩阵Rrect使极点转换到无穷远处。

首先创建平移向量T方向的旋转矩阵Rrec=[e1,e2,e3]，其中e1为与平移向量T同方向的极点，e2为图像与平移向量同一方向的向量，e3为垂直于e1与e2所在平面的向量，通过叉乘方式获得，RL=Rrect rl ，RRrect rr，最后转为旋转矩阵，在通过转置就得到最终的RL和RR，这里求得的RL和RR是用来校正左右图像到第三平面，进行行对齐。

    cvRodrigues2(&om, &r_r);        // 旋转向量转换为旋转矩阵
    cvMatMul(&r_r, matT, &t);     //两个数组对应元素的乘法
    int idx = fabs(_t[0]) > fabs(_t[1]) ? 0 : 1;
    _uu[2] = 1;
    cvCrossProduct(&uu, &t, &ww); //对两个三维向量做叉乘
    nt = cvNorm(&t, 0, CV_L2); //计算t的绝对范数
    CV_Assert(fabs(nt) > 0); //捕获异常而不是程序崩溃
    nw = cvNorm(&ww, 0, CV_L2);
    CV_Assert(fabs(nw) > 0);
    cvConvertScale(&ww, &ww, 1 / nw);
    cvCrossProduct(&t, &ww, &w3);
    nw = cvNorm(&w3, 0, CV_L2);
    CV_Assert(fabs(nw) > 0);
    cvConvertScale(&w3, &w3, 1 / nw);
    _uu[2] = 0;
    for (i = 0; i < 3; ++i)
    {
        _wr[idx][i] = -_t[i] / nt;
        _wr[idx ^ 1][i] = -_ww[i];
        _wr[2][i] = _w3[i] * (1 - 2 * idx);
    }
        cvGEMM(&wR, &r_r, 1, 0, 0, &Ri, CV_GEMM_B_T);
	    cvConvert( &Ri, _R1 );
    	cvGEMM(&wR, &r_r, 1, 0, 0, &Ri, 0);
    	cvConvert( &Ri, _R2 );

左右两个摄像机共面、行对齐后，分别计算两个相机的内参矩阵，即投影矩阵，过程为：
通过原始两相机的内参矩阵，与当前共面对齐后的图像进行比例计算，得到新的内参信息（fx，fy，这里的fx=fy）

newImgSize = newImgSize.width * newImgSize.height != 0 ? newImgSize : imageSize;
    const double ratio_x = (double)newImgSize.width / imageSize.width / 2;
    const double ratio_y = (double)newImgSize.height / imageSize.height / 2;
    const double ratio = idx == 1 ? ratio_x : ratio_y;
    fc_new = (cvmGet(_cameraMatrix1, idx ^ 1, idx ^ 1) + cvmGet(_cameraMatrix2, idx ^ 1, idx ^ 1)) * ratio;

分别对左右摄像机进行图像矫正为正常的视角，将变化后的点转换为齐次坐标系，同时改变相机内参，计算三维点在平面中的坐标，为简单起见，将两个摄影机的主要点设置为平均值。

    for( k = 0; k < 2; k++ )
    {
        const CvMat* A = k == 0 ? _cameraMatrix1 : _cameraMatrix2;
        const CvMat* Dk = k == 0 ? _distCoeffs1 : _distCoeffs2;
        CvPoint2D32f _pts[4] = {};
        CvPoint3D32f _pts_3[4] = {};
        CvMat pts = cvMat(1, 4, CV_32FC2, _pts);
        CvMat pts_3 = cvMat(1, 4, CV_32FC3, _pts_3);

        for( i = 0; i < 4; i++ )
        {
            int j = (i<2) ? 0 : 1;
            _pts[i].x = (float)((i % 2)*(nx));
            _pts[i].y = (float)(j*(ny));
        }
		//利用undistortPoints()函数将拍摄的图像矫正为正常的视角，便于检测。
        cvUndistortPoints( &pts, &pts, A, Dk, 0, 0 );
		//将变换后的点先变化为齐次坐标系
        cvConvertPointsHomogeneous( &pts, &pts_3 );

        //Change camera matrix to have cc=[0,0] and fc = fc_new
        double _a_tmp[3][3];
        CvMat A_tmp  = cvMat(3, 3, CV_64F, _a_tmp);
        _a_tmp[0][0]=fc_new;
        _a_tmp[1][1]=fc_new;
        _a_tmp[0][2]=0.0;
        _a_tmp[1][2]=0.0;
		//计算三维点在平面中的坐标.
        cvProjectPoints2( &pts_3, k == 0 ? _R1 : _R2, &Z, &A_tmp, 0, &pts );
        CvScalar avg = cvAvg(&pts);
        cc_new[k].x = (nx)/2 - avg.val[0];
        cc_new[k].y = (ny)/2 - avg.val[1];
    }

设置CALIB_ZERO_DISPARITY，让两幅校正后的图像的主点有相同的像素坐标

 if( flags & CALIB_ZERO_DISPARITY )
    {
        cc_new[0].x = cc_new[1].x = (cc_new[0].x + cc_new[1].x)*0.5;
        cc_new[0].y = cc_new[1].y = (cc_new[0].y + cc_new[1].y)*0.5;
    }

获取左右相机的投影P1，P2矩阵

 cvZero( &pp );
    _pp[0][0] = _pp[1][1] = fc_new;
    _pp[0][2] = cc_new[0].x;
    _pp[1][2] = cc_new[0].y;
    _pp[2][2] = 1;
    cvConvert(&pp, _P1);

    _pp[0][2] = cc_new[1].x;
    _pp[1][2] = cc_new[1].y;
    _pp[idx][3] = _t[idx]*fc_new; // baseline * focal length
    cvConvert(&pp, _P2);

校正映射：立体校正之后求得左右相机旋转矩阵R、投影矩阵P、重投影矩阵Q后，使用initUndistortRectifyMap()函数，调⽤两次：⼀次为左侧图像，⼀次为右侧图像，求映射变换矩阵
initUndistortRectifyMap(cameraMatrixL, distCoeffL, Rl, Pl, imageSize, CV_32FC1, mapLx, mapLy);
initUndistortRectifyMap(cameraMatrixR, distCoeffR, Rr, Pr, imageSize, CV_32FC1, mapRx, mapRy);

输入单相机内参，畸变参数，旋转矩阵R，投影参数矩阵P（R和P是通过立体矫正stereoRectify（）得到），原图像size大小，类型CV_32FC1，输出映射矩阵mapx，mapy

校正映射过程：
获取相机内参cameraMatrix、畸变矩阵distCoeffs、旋转矩阵matR、摄像机投影参数矩阵newCameraMatrix

	//相机内参、畸变矩阵
    Mat cameraMatrix = _cameraMatrix.getMat(), distCoeffs = _distCoeffs.getMat();
	//旋转矩阵、摄像机参数矩阵
    Mat matR = _matR.getMat(), newCameraMatrix = _newCameraMatrix.getMat();

创建相机内参矩阵A、投影参数矩阵Ar，旋转矩阵R、畸变矩阵distCoeffs:

    Mat_<double> R = Mat_<double>::eye(3, 3);
    Mat_<double> A = Mat_<double>(cameraMatrix), Ar;
    //A为相机内参   
    //Ar为摄像机坐标参数,
    if( !newCameraMatrix.empty() )
        Ar = Mat_<double>(newCameraMatrix);
    else
        Ar = getDefaultNewCameraMatrix( A, size, true );

    //R为旋转矩阵
    if( !matR.empty() )
        R = Mat_<double>(matR);

    //distCoeffs为畸变矩阵
    if( !distCoeffs.empty() )
        distCoeffs = Mat_<double>(distCoeffs);
    else
    {
        distCoeffs.create(14, 1, CV_64F);
        distCoeffs = 0.;
    }

通过LU分解求新的内参矩阵Ar与旋转矩阵R乘积的逆矩阵iR

Mat_<double> iR = (Ar.colRange(0,3)*R).inv(DECOMP_LU);
const double* ir = &iR(0,0);

从旧的内参矩阵中取出光心位置u0,v0作为主坐标点，和归一化焦距fx,fy

    double u0 = A(0, 2),  v0 = A(1, 2);
    double fx = A(0, 0),  fy = A(1, 1);

畸变参数计算，14个畸变系数，不过大多用到的只有(k1,k2,p1,p2)，k1,k2为径向畸变系数，p1,p2为切向畸变系数，用不到的置为0，tauX,tauY是梯形畸变

 	const double* const distPtr = distCoeffs.ptr<double>();
    double k1 = distPtr[0];
    double k2 = distPtr[1];
    double p1 = distPtr[2];
    double p2 = distPtr[3];
    double k3 = distCoeffs.cols + distCoeffs.rows - 1 >= 5 ? distPtr[4] : 0.;
    double k4 = distCoeffs.cols + distCoeffs.rows - 1 >= 8 ? distPtr[5] : 0.;
    double k5 = distCoeffs.cols + distCoeffs.rows - 1 >= 8 ? distPtr[6] : 0.;
    double k6 = distCoeffs.cols + distCoeffs.rows - 1 >= 8 ? distPtr[7] : 0.;
    double s1 = distCoeffs.cols + distCoeffs.rows - 1 >= 12 ? distPtr[8] : 0.;
    double s2 = distCoeffs.cols + distCoeffs.rows - 1 >= 12 ? distPtr[9] : 0.;
    double s3 = distCoeffs.cols + distCoeffs.rows - 1 >= 12 ? distPtr[10] : 0.;
    double s4 = distCoeffs.cols + distCoeffs.rows - 1 >= 12 ? distPtr[11] : 0.;
    double tauX = distCoeffs.cols + distCoeffs.rows - 1 >= 14 ? distPtr[12] : 0.;
    double tauY = distCoeffs.cols + distCoeffs.rows - 1 >= 14 ? distPtr[13] : 0.;

通过tauX,tauY计算倾斜图像传感器的梯形畸变矩阵matTilt，其中tauX,tauY用不到的话matTilt为单位矩阵

cv::Matx33d matTilt = cv::Matx33d::eye();
cv::detail::computeTiltProjectionMatrix(tauX, tauY, &matTilt);

求得上述提到的逆矩阵ir、梯形矩阵、主坐标点（u0，v0）、焦距（fx，fy）及畸变参数后，反向映射，遍历目标图像所有像素位置，找到畸变图像中对应位置坐标(u,v)，并分别保存坐标(u,v)到mapx和mapy中。
过程如下：


 parallel_for_(Range(0, size.height), 
 initUndistortRectifyMapComputer(size, map1, map2, m1type, ir, matTilt, u0, v0,fx, fy, k1, k2, p1, p2, k3, k4, k5, k6, s1, s2, s3, s4));

const int begin = range.start;
const int end = range.end;	
for( int i = begin; i < end; i++ )
 {        //定义映射表mapx和mapy行元素指针  
            float* m1f = map1.ptr<float>(i);//指向第i+1行第一个元素指针
            float* m2f = map2.empty() ? 0 : map2.ptr<float>(i);
            short* m1 = (short*)m1f;
            ushort* m2 = (ushort*)m2f;
			
			 //利用逆矩阵iR将二维图像坐标(j,i)转换到摄像机坐标系(_x,_y,_w)
            double _x = i*ir[1] + ir[2], _y = i*ir[4] + ir[5], _w = i*ir[7] + ir[8];

            int j = 0;
            //遍历每个像机坐标位置
            for( ; j < size.width; j++, _x += ir[0], _y += ir[3], _w += ir[6] )
            {
				//摄像机坐标系归一化，令Z=1
                double w = 1./_w, x = _x*w, y = _y*w;
				//根据畸变模型进行变换
                double x2 = x*x, y2 = y*y;
                double r2 = x2 + y2, _2xy = 2*x*y;
                double kr = (1 + ((k3*r2 + k2)*r2 + k1)*r2)/(1 + ((k6*r2 + k5)*r2 + k4)*r2);
                double xd = (x*kr + p1*_2xy + p2*(r2 + 2*x2) + s1*r2+s2*r2*r2);
                double yd = (y*kr + p1*(r2 + 2*y2) + p2*_2xy + s3*r2+s4*r2*r2);
				//根据求取的xd,yd将三维坐标重投影到二维畸变图像坐标(u,v)
                cv::Vec3d vecTilt = matTilt*cv::Vec3d(xd, yd, 1);
                double invProj = vecTilt(2) ? 1./vecTilt(2) : 1;
                double u = fx*invProj*vecTilt(0) + u0;
                double v = fy*invProj*vecTilt(1) + v0;
				//保存u,v的值到Mapx,Mapy中
                if( m1type == CV_16SC2 )
                {
                    int iu = cv::saturate_cast<int>(u*cv::INTER_TAB_SIZE);
                    int iv = cv::saturate_cast<int>(v*cv::INTER_TAB_SIZE);
                    m1[j*2] = (short)(iu >> cv::INTER_BITS);
                    m1[j*2+1] = (short)(iv >> cv::INTER_BITS);
                    m2[j] = (ushort)((iv & (cv::INTER_TAB_SIZE-1))*cv::INTER_TAB_SIZE + (iu & (cv::INTER_TAB_SIZE-1)));
                }
                else if( m1type == CV_32FC1 )
                {
                    m1f[j] = (float)u;
                    m2f[j] = (float)v;
                    // map_x实际上记录的是对应原图像中（i,j）位置的横坐标，map_y实际上记录的是（i,j）位置的纵坐标
                }
                else
                {
                    m1f[j*2] = (float)u;
                    m1f[j*2+1] = (float)v;
                }
            }
        }

initUndistortRectifyMap

校正映射参数：
输入单相机内参，畸变参数，旋转矩阵R，投影参数矩阵P（R和P是通过立体矫正stereoRectify（）得到），原图像size大小，类型CV_32FC1，输出映射矩阵mapx，mapy
校正映射过程：
1、获取相机内参cameraMatrix、畸变矩阵distCoeffs、旋转矩阵matR、摄像机投影参数矩阵newCameraMatrix
2、创建相机内参矩阵A、投影参数矩阵Ar，旋转矩阵R、畸变矩阵distCoeffs
3、通过LU分解求新的内参矩阵Ar与旋转矩阵R乘积的逆矩阵iR
4、从旧的内参矩阵中取出光心位置u0,v0作为主坐标点，和归一化焦距fx,fy
5、畸变参数计算，14个畸变系数，不过大多用到的只有(k1,k2,p1,p2)，k1,k2为径向畸变系数，p1,p2为切向畸变系数，用不到的置为0，tauX,tauY是梯形畸变
6、通过tauX,tauY计算倾斜图像传感器的梯形畸变矩阵matTilt，其中tauX,tauY用不到的话matTilt为单位矩阵
7、求得上述提到的逆矩阵ir、梯形矩阵、主坐标点（u0，v0）、焦距（fx，fy）及畸变参数后，反向映射，遍历目标图像所有像素位置，找到畸变图像中对应位置坐标(u,v)，并分别保存坐标(u,v)到mapx和mapy中。
①定义映射表1、2行元素指针
②利用逆矩阵iR将二维图像坐标(j,i)转换到摄像机坐标系(_x,_y,_w)
③遍历每个相机坐标位置，将相机坐标系归一化，令Z=1平面上。
④畸变模型的转换，求得xd，yd
⑤根据求取的xd,yd将三维坐标重投影到二维畸变图像坐标(u,v)
⑥保存u,v的值到Mapx,Mapy中
map_x实际上记录的是对应原图像中（i,j）位置的横坐标，map_y实际上记录的是（i,j）位置的纵坐标,而我们在这里把像素操作的i当做了横坐标,j当做了纵坐标

remap

remap( InputArray _src, OutputArray _dst,
                InputArray _map1, InputArray _map2,
                int interpolation, int borderType, const Scalar& borderValue )

像素重映射:
重映射，就是把一幅图像中某位置的像素放置到另一个图片指定位置的过程。为了完成映射过程, 我们需要获得一些插值为非整数像素的坐标,因为源图像与目标图像的像素坐标不是一一对应的
g(x,y) = f ( h(x,y) )
g( ) 是目标图像, f() 是源图像, 而h(x,y) 是作用于 (x,y) 的映射方法函数。简单的说就是改变图片的位置（左，右，上，下，颠倒翻转）
像素重映射参数:
输入源图像src，目标图像dst，输入记录源图像位置的横坐标Mapx，输入记录源图像位置的纵坐标Mapy，使用双线性插值方式INTER_LINEAR，边界模式使用默认值BORDER_CONSTANT，表示目标图像中“离群点（outliers）”的像素值不会被此函数修改，边界颜色，默认Scalar()黑色
对左右摄像头采集到的数据分别进行remap，使源图像中像素位置通过映射表mapx，mapy位置，映射到新的图像中。最后得到的图像就是共面、行对齐的图像。

二、源码中的方法

OpenCV双目视觉：Bouguet立体校正https://jingyan.baidu.com/article/a681b0de74312a3b1843460d.html

将旋转矩阵转换为旋转向量:
cvConvert函数用于图像和矩阵之间的相互转换为什么要用cvConvert 把IplImage转为矩阵？因为IplImage里的数据，你只能用uchar的形式存放，当你需要这些图像数据看作数据矩阵来运算时，0~255的精度显然满足不了要求；然而CvMat里却可以存放任意通道数、任意格式的数据，这个机制方便了研究中的这种需求，转化为矩阵就可以进行更自由的计算。
获得平均旋转向量，等比缩放一半：
函数 cvConvertScale 有多个不同的目的因此就有多个同义函数（如上面的#define所示）。该函数首先对输入数组的元素进行比例缩放，然后将shift加到比例缩放后得到的各元素上，即： dst(I)=src(I)*scale + (shift,shift,…)
旋转向量转换为旋转矩阵：
cvRodrigues2(）
旋转矩阵r_r 与平移矩阵相乘得到t(3,1)
cvMatMul()
cvCrossProduct(&uu, &t, &ww); //对两个三维向量做叉乘
cvNorm(&t, 0, CV_L2); //计算t的绝对范数
CV_Assert(fabs(nt) > 0); //捕获异常而不是程序崩溃
对WR矩阵值做变换，与旋转矩阵进行广义矩阵乘法分别得到左旋转矩阵和右旋转矩阵
void cvGEMM( const CvArr* src1, const CvArr* src2, double alpha,const CvArr* src3, double beta, CvArr* dst, int tABC=0 ); 广义矩阵的乘法
src1：第一输入数组
src2：第二输入数组
alpha：系数
src3“第三输入数组（偏移量），如果没有偏移量，可以为空（NULL）
beta：表示偏移量的系数
dst：输出数组
tABC：
转置操作标志，可以是0。当为0时，没有转置。或者还有下面的值的组合：
CV_GEMM_A_T：表示src1转置
CV_GEMM_B_T：表示src2转置
CV_GEMM_C_T：表示src3转置
例如，CV_GEMM_A_T+CV_GEMM_C_T对应
alpha*（src1转置）src2+beta（src3转置）
opencv实现中要先把旋转矩阵变为旋转向量，对旋转向量的模长平分，就得到可以把光轴摆平的左右矩阵，然后用这个矩阵乘以T，归一化得到e1，然后根据上面的公式构建e2,e3就可以通过叉乘获得，最后转为旋转矩阵，在通过转置就可以得到最终的RL和RR，RL和RR是用来校正左右图像到第三平面，行对齐
获取左右摄像头的内参及畸变系数利用undistortPoints()函数将拍摄的图像矫正为正常的视角，便于检测
cvUndistortPoints：https://yongqi.blog.csdn.net/article/details/52946821
cvConvertPointsHomogeneous//将变换后的点先变化为齐次坐标系

cvmGet直接存取矩阵元素

Opencv,计算三维点在平面中的坐标.
void cvProjectPoints2
(
const CvMat* objectPoints, //是需要投影的点的序列，是一个点位置的N3的矩阵。
const CvMat rvec,
const CvMat* tvec, //建立两个坐标系的联系
const CvMat* cameraMatrix,
const CvMat* distCoeffs,//内参数矩阵和形变系数
CvMat* imagePoints,//N2的矩阵将被写入计算结果
CvMat dpdrot=NULL,
CvMat* dpdt=NULL,
CvMat* dpdf=NULL,
CvMatdpdc=NULL,
CvMat dpddist=NULL //偏导数的雅克比矩阵
)
如果设置为CALIB_ZERO_DISPARITY的话，该函数会让两幅校正后的图像的主点有相同的像素坐标。否则该函数会水平或垂直的移动图像，以使得其有用的范围最大。
// 获取左右相机的投影P1，P2矩阵
icvGetRectangles功能是获取标准图像的有效像素(有效像素指在畸变图像中有对应像素的像素)所构成的区域的最大内接矩阵和最小外接矩阵，其实现方式是：取畸变图像中的一些特殊点(四条边上的点和中间区域的一些点)
当alpha为0时，取inner即内矩阵，用内矩阵大小作为新的图像大小，重新得到fx,fy,cx,cy，因此新的内参矩阵诞生了. 当alpha为1时，取outer即外矩阵。当alpha介于0~1时，则按照比例重新计算fx,fy,cx,cy。
//事实上，内矩阵等同于不含任何黑色边框的图幅大小，而外矩阵等同于原图大小。