最小二乘法(Least Squares Method)

最小二乘法(Least Squares Method)本身不是一种算法,而是一种损失函数(Loss Function)的模型。用最小二乘法表示损失函数后,再通过其他优化算法求解最优值。

 

1. 特征: $loss\_function=\sum(\hat{y}_i-y_i)^2 $

 

2. 与最大似然估计(MLE)的关系:形式等同于残差满足正态分布的最大似然估计

 

3. 解法:$\sum(\hat{y}_i-y_i)^2,$求偏导等于0的极值点

 

4. 线性最小二乘问题(Ordinary Least Squares (OLS))求解过程:

$$\sum(\hat{y}_i-y_i)^2$$

$$S(\beta)=|X\beta-Y|^2$$

$$\beta = arg min(S(\beta))$$

$$S'(\beta) = 2X^T(X\beta-Y)=0$$

$$X^TX\beta=X^TY$$

若$X^TX$非奇异(可逆),则:

$$\hat{\beta}=(X^TX)^{-1}X^TY$$

 

5. 本质:$Y$在$X$向量空间上的投影

 

6. 非线性最小二乘问题解法:梯度下降、高斯-牛顿法、L-M算法等

posted @ 2017-03-23 15:57  Clarence的笔记  阅读(1912)  评论(0编辑  收藏  举报