【算法研究与实现】最小二乘法直线拟合

作者：gnuhpc
出处：http://www.cnblogs.com/gnuhpc/

1.原理
在现实中经常遇到这样的问题，一个函数并不是以某个数学表达式的形式给出，而是以一些自变量与因变量的对应表给出，老师讲课的时候举的个例子是犯罪人的身高和留下的脚印长，可以测出一些人的数据然后得到一张表，它反应的是一个函数，回归的意思就是将它还原成数学表达式，这个式子也称为经验表达式，之所以叫经验就是说它不完全是实际中的那样准确，是有一定偏差的，只是偏差很小罢了。

最小二乘法
设经验
方程是y=F(x)，方程中含有一些待定系数an，给出真实值{(xi,yi)|i=1,2,...n},将这些x,y值代入方程然后作
差，可以描述误差：yi-F(xi)，为了考虑整体的误差，可以取平方和，之所以要平方是考虑到误差可正可负直接相加可以相互抵消，所以记误差为：

e=∑(yi-F(xi))^2

它是一个多元函数，有an共n个未知量，现在要求的是最小值。所以必然满足对各变量的偏导等于0，于是得到n个方程：

de/da1=0
de/da2=0
...
de/dan=0

n个方程确定n个未知量为常量是理论上可以解出来的。用这种误差分析的方法进行回归方程的方法就是最小二乘法。

线性回归
如果经验方程是线性的，形如y=ax+b，就是线性回归。按上面的分析，误差函数为：

e=∑(yi-axi-b)^2

各偏导为：

de/da=2∑(yi-axi-b)xi=0
de/db=-2∑(yi-axi-b)=0

于是得到关于a,b的线性方程组：

(∑xi^2)a+(∑xi)b=∑yixi
(∑xi)a+nb=∑yi

设A=∑xi^2,B=∑xi,C=∑yixi,D=∑yi，则方程化为：

Aa+Bb=C
Ba+nb=D

解出a,b得：

a=(Cn-BD)/(An-BB)
b=(AD-CB)/(An-BB)
这就是我们要进行的算法。
2.C++实现
/*
* =====================================================================================
*
*       Filename: nihe.cpp
*
*    Description: A least square method for fitting a curve
*
*        Version: 1.0
*        Created: 03/21/2009 12:32:56 PM
*       Revision: none
*       Compiler: gcc
*
*         Author: Futuredaemon (BUPT), gnuhpc@gmail.com
*        Company: BUPT_UNITED
*
* =====================================================================================
*/
#include <stdlib.h>
#include <iostream>
#include <valarray>
using namespace std;
int main(int argc, char *argv[])
{
    int num = 0;
    cout << " Input how many numbers you want to calculate:";
    cin >> num;
    valarray<double> data_x(num);
    valarray<double> data_y(num);
    while( num )
    {
        cout << "Input the "<< num <<" of x:";
        cin >> data_x[num-1];
        cout << "Input the "<< num <<" of y:";
        cin >> data_y[num-1];
        num--;
    }
    double A =0.0;
    double B =0.0;
    double C =0.0;
    double D =0.0;
    A = (data_x*data_x).sum();
    B = data_x.sum();
    C = (data_x*data_y).sum();
    D = data_y.sum();
    double k,b,tmp =0;
    if(tmp=(A*data_x.size()-B*B))
    {
        k = (C*data_x.size()-B*D)/tmp;
        b = (A*D-C*B)/tmp;
    }
    else
    {
        k=1;
        b=0;
    }
    cout <<"k="<<k<<endl;
    cout <<"b="<<b<<endl;
    return 0;
}
3.OpenCV结构实现
#include "cv.h"
#include <iostream>
using namespace std;
int main(int argc, char *argv[])
{
int i=0;
int j=0;
int num;
double A,B,C,D;
double k,b,tmp=0;
cout <<"Input how many numbers you want to calculate:";
cin >>num;
CvMat *mat1=cvCreateMat(1,num,CV_64FC1);
CvMat *mat2=cvCreateMat(1,num,CV_64FC1);
CvMat *mattmp=cvCreateMat(1,num,CV_64FC1);
for (j=0;j<mat1->cols;j++)
    {
      cout << "data X"<<j<<"=";
      cin>>CV_MAT_ELEM(*mat1,double,0,j);
      cout << "data Y"<<j<<"=";
      cin>>CV_MAT_ELEM(*mat2,double,0,j);
    }
for (j=0;j<mat1->cols;j++)
    {
      cout<<"X="<<CV_MAT_ELEM(*mat1,double,0,j)
          <<",Y="<<CV_MAT_ELEM(*mat2,double,0,j)<<endl;
    }
cvMul(mat1,mat1,mattmp,1);
A = cvSum(mattmp).val[0];
B = cvSum(mat1).val[0];
cvMul(mat1,mat2,mattmp,1);
C = cvSum(mattmp).val[0];
D = cvSum(mat2).val[0];
tmp = A*mat1->cols-B*B;
k = (C*mat1->cols-B*D)/tmp;
b = (A*D-C*B)/tmp;
cout << "k=" << k <<endl;
cout << "b=" << b <<endl;
cvReleaseMat(&mat1);
cvReleaseMat(&mat2);
return 0;
}

作者：gnuhpc
出处：http://www.cnblogs.com/gnuhpc/

posted @ 2012-12-09 14:30 gnuhpc 阅读(20987) 评论(0) 编辑收藏举报

刷新页面返回顶部

gnuhpc的百草园和三味书屋

忙时不慌，闲时不荒。

【算法研究与实现】最小二乘法直线拟合

公告