Ceres-Solver库入门

示例1:求极值

首先我们以Ceres库官网中的Hello World例子来进行说明。这里例子的目的是为了计算方程取得最小值时x的值。从这个方程很容易看出来当x=10时,f(x)取得最小值0。这个方程虽然没有什么实际意义,但是为了演示Ceres库还是很不错的例子。

1、编写一个g(x)=10-x的残差方程。代码如下:

structCostFunctor {
   template <typename T>
   bool operator()(const T* const x, T* residual) const {
     residual[0] = T(10.0) - x[0];
     return true;
   }
};

这里值得注意的是,必须要编写一个重载()运算,而且必须使用模板类型,所有的输入参数和输出参数都要使用T类型。

2、当我们写完了上面的计算残差的方程,接下来就可以使用Ceres库来构造一个求解非线性最小二乘法的Problem来进行求解未知数了。代码如下:

int main(int argc, char** argv) 
{
  google::InitGoogleLogging(argv[0]);

  // 指定求解的未知数的初值,这里设置为5.0
  double initial_x = 5.0;
  double x = initial_x;

  // 建立Problem
  Problem problem;

   // 建立CostFunction(残差方程)
   CostFunction* cost_function =
       new AutoDiffCostFunction<CostFunctor, 1, 1>(new CostFunctor);
   problem.AddResidualBlock(cost_function, NULL, &x);

   // 求解方程!
   Solver::Options options;
   options.linear_solver_type = ceres::DENSE_QR;
   options.minimizer_progress_to_stdout = true;
   Solver::Summary summary;
   Solve(options, &problem, &summary);

   std::cout << summary.BriefReport() << "\n";
   std::cout << "x : " << initial_x
             << " -> " << x << "\n";
   return 0;
}
AutoDiffCostFunction需要CostFunctor作为输入。上面的例子编译执行后,会输出下面的信息:

   0: f: 1.250000e+01 d: 0.00e+00 g: 5.00e+00h: 0.00e+00 rho: 0.00e+00 mu: 1.00e+04 li: 0 it: 6.91e-06 tt: 1.91e-03
   1: f: 1.249750e-07 d: 1.25e+01 g: 5.00e-04h: 5.00e+00 rho: 1.00e+00 mu: 3.00e+04 li: 1 it: 2.81e-05 tt: 1.99e-03
   2: f: 1.388518e-16 d: 1.25e-07 g: 1.67e-08h: 5.00e-04 rho: 1.00e+00 mu: 9.00e+04 li: 1 it: 1.00e-05 tt: 2.01e-03
CeresSolver Report: Iterations: 2, Initial cost: 1.250000e+01, Final cost:1.388518e-16, Termination: PARAMETER_TOLERANCE.
x : 5-> 10

3、从上面的输出信息中可以看出,经过三次迭代计算,求得的x值为10时可以取得最小值。接下来我们分析下main函数中的代码。

第2行代码为Google的log库,详细内容请参考Google log库的相关说明。

第5、6行为定义了求解未知数的初值,初值设置为5。

第9行,声明一个Problem对象,用于求解。

第12行,声明一个残差方程,CostFunction通过模板类AutoDiffCostFunction来进行构造,第一个模板参数为残差对象,也就是最开始写的那个那个带有重载()运算符的结构体,第二个模板参数为残差个数,第三个模板参数为未知数个数,最后参数是结构体对象。

第14行,将观测值和残差方程加入Problem对象中,如果有多个观测值,都需要加进去,这点可以看后面的示例。

第16~19行,定义一个求解选项,里面主要包括对方程线性化的方式,迭代次数等,具体参考官网帮助文档。

第20行,定义一个求解结果报告。

第21行,调用Solve函数进行求解,第一个参数就是求解选项,第二个参数为Problem指针,第三个参数为求解报告指针。

第23行,输出求解报告信息。

第24行,输出求解前的初值和求解后的值。

示例2:曲线拟合

下面的例子是指定一系列的点对来拟合一个曲线的系数。这一系列点对是通过曲线插值的点然后添加了标准差的高斯噪声。我们要拟合的曲线形式为:

首先我们定义一个残差结构体,用于计算每一个观测值的残差。代码如下:

struct ExponentialResidual {
  ExponentialResidual(double x, double y)
      : x_(x), y_(y) {}
 
  template <typename T>
  bool operator()(const T* const m, const T* const c, T* residual) const {
    residual[0] = T(y_) - exp(m[0] * T(x_) + c[0]);
    return true;
  }
 
 private:
  // 观测值
  const double x_;
  const double y_;
};
假设观测点对全部存在数组data中,data中共有2n个数,下面的代码用来演示如何将每个观测点对都加入到Problem中用于后续求解。

double m = 0.0;
double c = 0.0;

Problem problem;
for (int i = 0; i < kNumObservations; ++i) 
{
  CostFunction* cost_function =
       new AutoDiffCostFunction<ExponentialResidual, 1, 1, 1>(
           new ExponentialResidual(data[2 * i], data[2 * i + 1]));
  problem.AddResidualBlock(cost_function, NULL, &m, &c);
}

对上面的代码大致说明下,首先定义m和c的初值都为0,然后定义一个Problem对象,用于后续求解。观测点的个数共有kNumObservations个,遍历每个观测点对,然后new一个残差方程并将其加入Problem中。过程和示例1一样,只不过这里的观测值比较多,需要用一个循环来进行处理。

后续的处理和示例1完全一样,定义一个求解选项和求解报告,然后调用Solve函数进行求解即可。下面时输出的求解过程以及m和c的结果。

   0: f: 1.211734e+02 d: 0.00e+00 g: 3.61e+02 h: 0.00e+00 rho: 0.00e+00 mu: 1.00e+04 li:  0 it: 0.00e+00 tt: 0.00e+00
   1: f: 1.211734e+02 d:-2.21e+03 g: 3.61e+02 h: 7.52e-01 rho:-1.87e+01 mu: 5.00e+03 li:  1 it: 0.00e+00 tt: 0.00e+00
   2: f: 1.211734e+02 d:-2.21e+03 g: 3.61e+02 h: 7.51e-01 rho:-1.86e+01 mu: 1.25e+03 li:  1 it: 0.00e+00 tt: 0.00e+00
   3: f: 1.211734e+02 d:-2.19e+03 g: 3.61e+02 h: 7.48e-01 rho:-1.85e+01 mu: 1.56e+02 li:  1 it: 0.00e+00 tt: 0.00e+00
   4: f: 1.211734e+02 d:-2.02e+03 g: 3.61e+02 h: 7.22e-01 rho:-1.70e+01 mu: 9.77e+00 li:  1 it: 0.00e+00 tt: 0.00e+00
   5: f: 1.211734e+02 d:-7.34e+02 g: 3.61e+02 h: 5.78e-01 rho:-6.32e+00 mu: 3.05e-01 li:  1 it: 0.00e+00 tt: 0.00e+00
   6: f: 3.306595e+01 d: 8.81e+01 g: 4.10e+02 h: 3.18e-01 rho: 1.37e+00 mu: 9.16e-01 li:  1 it: 0.00e+00 tt: 0.00e+00
   7: f: 6.426770e+00 d: 2.66e+01 g: 1.81e+02 h: 1.29e-01 rho: 1.10e+00 mu: 2.75e+00 li:  1 it: 0.00e+00 tt: 0.00e+00
   8: f: 3.344546e+00 d: 3.08e+00 g: 5.51e+01 h: 3.05e-02 rho: 1.03e+00 mu: 8.24e+00 li:  1 it: 0.00e+00 tt: 0.00e+00
   9: f: 1.987485e+00 d: 1.36e+00 g: 2.33e+01 h: 8.87e-02 rho: 9.94e-01 mu: 2.47e+01 li:  1 it: 0.00e+00 tt: 0.00e+00
  10: f: 1.211585e+00 d: 7.76e-01 g: 8.22e+00 h: 1.05e-01 rho: 9.89e-01 mu: 7.42e+01 li:  1 it: 0.00e+00 tt: 0.00e+00
  11: f: 1.063265e+00 d: 1.48e-01 g: 1.44e+00 h: 6.06e-02 rho: 9.97e-01 mu: 2.22e+02 li:  1 it: 0.00e+00 tt: 0.00e+00
  12: f: 1.056795e+00 d: 6.47e-03 g: 1.18e-01 h: 1.47e-02 rho: 1.00e+00 mu: 6.67e+02 li:  1 it: 0.00e+00 tt: 0.00e+00
  13: f: 1.056751e+00 d: 4.39e-05 g: 3.79e-03 h: 1.28e-03 rho: 1.00e+00 mu: 2.00e+03 li:  1 it: 0.00e+00 tt: 0.00e+00
Ceres Solver Report: Iterations: 13, Initial cost: 1.211734e+02, Final cost: 1.056751e+00, Termination: FUNCTION_TOLERANCE.
Initial m: 0 c: 0
Final   m: 0.291861 c: 0.131439

从上面输出信息可以看出,开始m和c均为0时,残差大小为121.173,迭代结束m=0.291861,c=0.131439时残差大小为1.05675。计算和m和c的值与我们的理论值m=3,c=0.1有不小的差异,当我们将m=3,c=0.1带入方程计算的残差大小为1.082425。可以看出m=3,c=0.1时的残差比我们计算的m和c的值的残差还要大。所以说这些点最精确的值应该是我们计算的值,而不是理论值(与添加的高斯噪声有很大的关系)。下面是观测点、拟合点以及曲线的图像。

示例3:单像空间后方交会

通过上面两个示例大致应该熟悉了Ceres库的使用方式,下面我们编写一个求解摄影测量学里面最基础的一个问题,也就是单张像片的空间后方交会程序。学过《摄影测量学》的人肯定知道,后方交会的求解过程,是非常的麻烦,需要将共线方程求偏导数线性化,然后迭代计算外方位元素。

首先给出共线方程:

式中:x0y0和f为内方位元素,一般为已知量,abc为旋转矩阵,使用三个角元素来表示为:

按照教科书上的求解外方位元素的步骤,都需要10步左右,而且中间还需要求改正数迭代计算,非常复杂。这部分内容可以参考下面基本教科书中的内容:

[1]《摄影测量学》张剑清 潘励 王树根武汉大学出版社 P17-P23

[2]《摄影测量学》王佩军 徐亚明 武汉大学出版社 P60-P67

[3]《摄影测量学》林君建 苍桂华 国防工业出版社 P49-P55

  下面我们按照Ceres库的方法来编写后方交会的代码,首先编写一个带有模板重载函数()的结构体,用于计算残差。

struct BackCrossResidual
{
  /*
  * X, Y, Z, x, y 分别为观测值,f为焦距
  */
  BackCrossResidual(double X, double Y, double Z, double x, double y, double f)
      :_X(X), _Y(Y), _Z(Z), _x(x), _y(y), _f(f){}
 
  /*
  * pBackCrossParameters:-2分别为Xs、Ys、Zs,3-5分别为Phi、Omega、Kappa
  */
  template <typename T>
  bool operator () (const T * const pBackCrossParameters, T* residual) const
  {
      T dXs = pBackCrossParameters[0];
      T dYs = pBackCrossParameters[1];
      T dZs = pBackCrossParameters[2];
      T dPhi = pBackCrossParameters[3];
      T dOmega = pBackCrossParameters[4];
      T dKappa = pBackCrossParameters[5];
 
      T a1  = cos(dPhi)*cos(dKappa) - sin(dPhi)*sin(dOmega)*sin(dKappa);
      T a2  = -cos(dPhi)*sin(dKappa) - sin(dPhi)*sin(dOmega)*cos(dKappa);
      T a3  = -sin(dPhi)*cos(dOmega);
      T b1 = cos(dOmega)*sin(dKappa);
      T b2 = cos(dOmega)*cos(dKappa);
      T b3 = -sin(dOmega);
      T c1 = sin(dPhi)*cos(dKappa) + cos(dPhi)*sin(dOmega)*sin(dKappa);
      T c2 = -sin(dPhi)*sin(dKappa) + cos(dPhi)*sin(dOmega)*cos(dKappa);
      T c3 = cos(dPhi)*cos(dOmega);
 
      // 有两个残差
      residual[0]= T(_x) +T(_f) * T( (a1*(_X-dXs) + b1*(_Y-dYs) + c1*(_Z-dZs)) / ((a3*(_X-dXs) + b3*(_Y-dYs) + c3*(_Z-dZs))));
      residual[1]= T(_y) +T(_f) * T( (a2*(_X-dXs) + b2*(_Y-dYs) + c2*(_Z-dZs)) / ((a3*(_X-dXs) + b3*(_Y-dYs) + c3*(_Z-dZs))));
 
      return true;
  }
 
private:
  const double _X;
  const double _Y;
  const double _Z;
  const double _x;
  const double _y;
  const double _f;
};

对上面的代码解释下,首先有个构造函数,传入的参数共有6个,其中五个是控制点坐标(像方坐标两个xy和物方坐标三个XYZ),另外一个是相机的焦距f。

在重载()函数中,需要的参数初值和残差。初值一共有六个,三个线元素和三个角元素。将三个角元素处理成旋转矩阵所需要的九个参数。

最后按照共线方程编写残差计算公式,这里需要注意的是,一组点可以计算出两个残差,分别是X和Y。

接下来是调用函数,使用的数据是参考书[1]P39第9题(或参考书[2]P89第3题)。题目中给定的相机焦距为153.24mm,坐标点如下表:

点号

像点坐标

地面坐标

x(mm)

y(mm)

X(m)

Y(m)

Z(m)

1

-86.15

-68.99

36589.41

25273.32

2195.17

2

-53.40

82.21

37631.08

31324.51

728.69

3

-14.78

-76.63

39100.97

24934.98

2386.50

4

10.46

64.43

40426.54

30319.81

757.31

代码如下:

int main(int argc, char** argv)
{
  google::InitGoogleLogging(argv[0]);
 
  const char *pszFilename= "C:\\后方交会\\sourcedata.txt";
 
  FILE* fid = fopen(pszFilename,"rt");
  if(!fid)
      return NULL;
 
  int nCount = 4;
  double* pData = new double[5 * nCount];
  memset(pData, 0, sizeof(double)* 5 * nCount);
 
  double dBackCrossParameters[6] = {0};   //初值
  for(int i=0;i<nCount;i++)
  {
      double* pTmp = pData+5*i;
      fscanf(fid,"%lf %lf %lf%lf %lf",pTmp,pTmp+1,pTmp+2,pTmp+3,pTmp+4);
 
      dBackCrossParameters[0]+= pTmp[2]; //X
      dBackCrossParameters[1]+= pTmp[3]; //Y
  }
 
  fclose(fid);
 
  dBackCrossParameters[0]/= nCount;
  dBackCrossParameters[1]/= nCount;
 
  double df = 153.24; //mm
  dBackCrossParameters[2]= 50*df;
 
  Problem problem;
  for (int i = 0; i < nCount;++i)
  {
      double* pPoint = pData+ 5*i;
 
      BackCrossResidual*pResidualX = newBackCrossResidual(pPoint[2],pPoint[3], pPoint[4],pPoint[0]/1000, pPoint[1]/1000,df/1000);
      problem.AddResidualBlock(newAutoDiffCostFunction<BackCrossResidual, 2, 6>(pResidualX), NULL,dBackCrossParameters);
  }
 
  Solver::Options m_options;
  Solver::Summary m_summary;
  m_options.max_num_iterations = 25;
  m_options.linear_solver_type = ceres::DENSE_QR;
  m_options.minimizer_progress_to_stdout = true;
 
  Solve(m_options, &problem,&m_summary);
 
  fprintf(stdout,"Xs=%lfYs=%lf Zs=%lf\n",dBackCrossParameters[0],dBackCrossParameters[1],dBackCrossParameters[2]);
  fprintf(stdout,"Phi=%lfOmega=%lf Kappa=%lf\n",dBackCrossParameters[3],dBackCrossParameters[4],dBackCrossParameters[5]);
  fprintf(stdout,"%s\n",m_summary.FullReport().c_str());
 
  return 0;
}

接下来对上面的代码进行说明,首先读取坐标点对,一共有4对。一对点包含五个值。将所有的点都读到数组pData中。

接下来定义一个数组用来保存未知数和迭代初值。根据后方交会流程,三个角元素的初值在垂直摄影时可以认为其值为0,而对于三个线元素,Xs和Ys初值用所有的控制点的物方横坐标和纵坐标的均值,而Zs根据焦距和摄影比例尺坟墓共同决定。

然后构造一个Problem对象,并将每个控制点作为观测值构造一个误差方程,需要注意的是像平面坐标单位要和物方坐标单位一致,由于像方坐标和焦距都是毫米,所以都要除以1000换算为米。

程序执行的结果如下图所示,计算的结果与参考书[1]中给出的参考答案完全一样。此外用我之前用偏导数线性化求解的结果也是一致的,从上面的代码可以看出,使用Ceres库完全可以将很复杂的非线性问题用非常简单的代码来求解。


posted on 2013-11-18 18:29  王大王  阅读(4526)  评论(0编辑  收藏  举报

导航