ORB-SLAM 代码笔记（五）Frame类

Frame类的成员变量主要包含从摄像头获取的图像的

1. 特征点信息（关键点+描述字）

2. 尺寸不变特征所用金字塔信息，这些都定义在ORBextractor对象中

3. 词袋模型参数，用于跟踪失败情况下重定位

4. 相机参数，深度阈值

5. 当前帧的id，时间戳，相对世界坐标系位姿，参考关键帧，特征点对应地图点及其是否是外点

6. 特征点网格分配情况，以及当前帧相对世界坐标的位姿（包括位姿矩阵的更新，以及相机光心坐标）。

每获取一帧图像，mnId++，因此30fps的相机，一秒构建30个Frame对象。

双目，RGB-D和单目对应重载的构造函数。

双目构建的Frame对象：

提取特征加入双线程同步提取，0,1代表左目和右目，两张图片提取的特征点会放在不同的vector中，对于单目和RGB-D来说，右目不使用。

thread threadLeft(&Frame::ExtractORB,this,0,imLeft);
thread threadRight(&Frame::ExtractORB,this,1,imRight);
threadLeft.join();
threadRight.join();

向量mvKeys中存放N个提取出的左图关键点，mDescriptor中存放提取出的左图描述子，右图的放在mvKeysRight和mDescriptorsRight中；

然后进行畸变矫正（由OpenCV完成），然后进行双目匹配（记录左图中特征点对应的右图坐标，以及恢复出的深度）；

初始化地图点及其外点；

　　mvpMapPoints = vector<MapPoint*>(N,static_cast<MapPoint*>(NULL));
　　mvbOutlier = vector<bool>(N,false);

最后将关键点分布到64*48分割而成的网格中（目的是加速匹配以及均匀化关键点分布）。

RGBD构建的Frame对象：

和双目类似，但是不需要双目匹配，只需恢复出右图中深度>0的横坐标和深度即可。

单目构建的Frame对象：

和双目类似，但是不包含匹配信息：

mvuRight = vector<float>(N,-1);
mvDepth = vector<float>(N,-1);

Frame类还提供了一些与自己关联紧密的函数，用于其他模块：

1. 设置当前帧的姿态，并更新当前帧相机在世界坐标系下的位姿，中心点位置；

2. 判断一个MapPoint是否在视角范围内：

bool Frame::isInFrustum(MapPoint *pMP, float viewingCosLimit)
{  // 注意这里的MapPoint是从SearchLocalPoint传递进来的，具备一定信息量
    pMP->mbTrackInView = false;
    cv::Mat P = pMP->GetWorldPos(); 

    const cv::Mat Pc = mRcw*P+mtcw; // 这里的R，t是经过初步的优化后的
    const float &PcX = Pc.at<float>(0);
    const float &PcY = Pc.at<float>(1);
    const float &PcZ = Pc.at<float>(2);

    if(PcZ<0.0f)
        return false;

    // Project in image and check it is not outside
    const float invz = 1.0f/PcZ;
    const float u=fx*PcX*invz+cx;
    const float v=fy*PcY*invz+cy;

    if(u<mnMinX || u>mnMaxX)
        return false;
    if(v<mnMinY || v>mnMaxY)
        return false;

    // Check distance is in the scale invariance region of the MapPoint
    // 每一个地图点都是对应于若干尺度的金字塔提取出来的，具有一定的有效深度，如果相对当前帧的深度超过此范围，返回False
    const float maxDistance = pMP->GetMaxDistanceInvariance();
    const float minDistance = pMP->GetMinDistanceInvariance();
    // 世界坐标系下，相机到3D点P的向量, 向量方向由相机指向3D点P
    const cv::Mat PO = P-mOw;
    const float dist = cv::norm(PO);

    if(dist<minDistance || dist>maxDistance)
        return false;

    // Check viewing angle
    // 每一个地图点都有其平均视角，是从能够观测到地图点的帧位姿中计算出
    // 如果当前帧的视角和其平均视角相差太大，返回False
    cv::Mat Pn = pMP->GetNormal();// |Pn|=1

    const float viewCos = PO.dot(Pn)/dist; //  = P0.dot(Pn)/(|P0|*|Pn|); |P0|=dist 

    if(viewCos<viewingCosLimit)
        return false;

    // Predict scale in the image
    // 根据深度预测尺度（对应特征点在一层）
    const int nPredictedLevel = pMP->PredictScale(dist,this);

    // Data used by the tracking
    // 标记该点将来要被投影
    pMP->mbTrackInView = true;
    pMP->mTrackProjX = u;
    pMP->mTrackProjXR = u - mbf*invz; //该3D点投影到双目右侧相机上的横坐标
    pMP->mTrackProjY = v;
    pMP->mnTrackScaleLevel = nPredictedLevel;
    pMP->mTrackViewCos = viewCos;

    return true;
}

View Code

3. 在某块区域内获取特帧点：

vector<size_t> Frame::GetFeaturesInArea(const float &x, const float  &y, const float  &r, const int minLevel, const int maxLevel) const；

其中，minLevel和maxLevel考察特征点是从图像金字塔的哪一层提取出来的。

4. 将当前帧的描述子矩阵（可以转换成向量），转换成词袋模型向量（DBoW2::BowVector mBowVec； DBoW2::FeatureVector mFeatVec；）：

void Frame::ComputeBoW(){...}

5. 将特征点坐标（给id即可）反投影到3D地图点（世界坐标）：

cv::Mat Frame::UnprojectStereo(const int &i){}

最后，是Frame类中最重要的一个算法，双目匹配以及恢复特征点的深度

图像金字塔：0层是原始图。对0层高斯核卷积后，降采样（删除所有偶数行和偶数列）即可得到高斯金字塔第1层；插入0用高斯卷积恢复成原始大小，与0层相减，得到0层拉普拉斯金字塔，对应的是0层高斯金字塔在滤波降采样过程中丢失的信息，在其上可以提取特征。然后不断降采样，获得不同层的高斯金字塔与拉普拉斯金字塔，提取出的特征对应的尺度与金字塔的层数是正相关的。层数越高，对应的尺度越大，尺度不确定性越高。通过对图像的这种处理，我们可以提取出尺寸不变的的特征。但是在特征匹配时，需要考虑到提取特征点时对应的层数（尺度）。

在匹配左右帧的特征点时，虽然已经经过了极线矫正，但是不能仅仅搜索极线对应的同一行像素点，而应该根据右目提取特征点时的尺度（金字塔层数），确定一个极线附近的扫描范围r，这个带状范围内均包含这个特征信息。

const float r = 2.0f*mvScaleFactors[mvKeysRight[iR].octave];

1. 对左目相机每个特征点，通过描述子在右目带状搜索区域找到匹配点；

2. 通过SAD匹配提高像素匹配修正量bestincR；

3. 做抛物线拟合找谷底得到亚像素匹配deltaR；

4. 剔除SAD匹配偏差较大的匹配特征点。

posted @ 2017-02-15 16:43 徐尚阅读(4222) 评论(1) 编辑收藏举报

刷新页面返回顶部

SLAM-BJTShang

ORB-SLAM 代码笔记（五）Frame类

公告