通俗易懂最小二乘法与牛顿法总结:线性与非线性,文末有Python和c++代码编程实践教程
推荐开源项目:简单的SLAM与机器人教程与编程实践-github
今日疯言疯语:
很多算法看不懂大概率是这些算法做出的一些假设你不知道——@Ai酱
线性最小二乘法||Ax-y||可以直接求解
问题:已知A和y,需要求x。并且需要最小化||Ax-y||。
下面是求解x的方法:
之所以要乘个是因为A很可能不是方阵,不是方阵是不能求逆的。
非线性最小二乘法需要用牛顿法求解
问题:已知f()表达式和y,需要求x。并且需要最小化。这个||xx||是指范数的意思,你把它当做是绝对值或者平方就行.而我们知道的最小值是0,所以我们就是想求等于0时x的取值。
什么是牛顿法?
它是一个用来求某个函数最小值所在点的自变量的值算法。牛顿法这和这里我们需要求解的问题有什么联系。我们就是想求这个函数的最小值点的自变量x。如果你还不了解为何要哦用牛顿法,你可以再看看前面的问题描述。
牛顿法思想是怎样的?具体步骤怎么做?
注意:用牛顿法(Newton’s Method)求解一个函数最小值点对应的自变量值时,默认对这个函数有个假设“这个函数的最小值接近于0”。也就是说我们知道这个函数的最小值。但是就是不知道取得最小值时自变量的值。我们要用牛顿法求这个自变量的值。
只要提到牛顿法一定要注意前面这个假设,很多算法看不懂大概率是这些算法做出的一些假设你不知道。
我们整理下思路,现在想求的最小值点时候对应的x。并且知道的最小值是0. 牛顿法的思路是随便先猜最小值点对应的x。然后慢慢修正它直到接近最小值点对应的自变量值。假如我猜是。然后怎么修正这个猜测值呢?现在我们已知一个点,并且知道在这个点时函数g(x)的导数值。那么我们根据高中学的点斜式就可以写出经过这个点的切线方程。我们可以把这个切线当做的近似。前面提到了牛顿法有一个假设(函数g(x)的最小值等于0),现在这个假设开始发挥大作用了。现在是对g(x)的近似,那么我们可以令函数值y=0求得一个x。把这个x当做最小值点对应自变量值的一个新的猜测。然后重复以上过程直到找到一个变量使得非常接近于0.此时的就是我们要求的g(x)的最小值时对应的自变量的值。
Python编程实践非线性的最小二乘法
假如你需要求sin(x)=0.233时的x的取值。注意x的单位是弧度。虽然你可以调用Python代码里面的arcsin这个函数,但是为何我们不试试自己编程实现arcsin呢?引用某知名网友的话“抱着造轮子的心态学东西(逃”。
我们整理下思路现在的最小二乘法问题就是我们需要求g(x) = |sin(x)-0.233|的最小值所在点的自变量值x。
在使用牛顿法前我们不要忘了牛顿法是有个假设的。那就是目标函数g(x)的最小值是0.显然现在我们这个例子是满足的。
第一步:随便猜g(x) 最小值所在点对应的自变量值. 现在我们假设这个自变量值是。所以我们得到了一个点。而且知道这个点的导数值。然后我们可以写出经过这个点的切线方程。所以切线方程为
第二步:将切线看做是原函数的一个近似,然后令切线函数值y等于0来修正第一步的猜测值。根据可以解得。我们可以将这个字作为g(x) 最小值所在点对应的自变量值的一个新的猜测值。
重复上面两步直到g(猜测值)非常接近于0.
下面是Python代码:
'''牛顿法求解非线性最小二乘法
author: @Ai酱
欢迎评论
'''
import math
import random
def g(x0):
'''
目标函数在x0处的函数值
Args:
x0 自变量:角度,单位是弧度
'''
return math.sin(x0) + 0.233
def dg_dx(x0):
'''
目标函数g(x)在x0处导数g'(x0)
Args:
x0 自变量:角度,单位是弧度
'''
return math.cos(x0)
# 1. 为g(x) 最小值所在点对应的自变量值随便猜一个值
x0 = random.random()
while abs(g(x0)) > 0.001: # 一直迭代直到g(x0)接近0
# 2. 令切线函数值y=0求得一个x值,将它作为一个新的猜测值修正原先的猜测x0
new_x0 = x0 - g(x0)/dg_dx(x0)
x0 = new_x0
print("我们自己写的牛顿法求得的arcsin(0.233)=",x0)
# 我们用python自带的arcsin检验下
print("Python自带的arcsin求得的arcsin(0.233)=",math.asin(0.233))
如果你看不懂Python代码,下面是我写的c++代码:
#include<math.h>
#include<iostream>
using namespace std;
/**
* 返回g(x)在x0处的函数值g(x0)
* params:
* x 自变量:角度,单位弧度
*/
float g(float x0)
{
return sin(x0) - 0.2333;
}
/**
* 目标函数g(x)在x0处导数g'(x0)
* params:
* x0 自变量:角度,单位是弧度
*/
float dg_dx(float x0)
{
return cos(x0);
}
int main()
{
// 1. 为g(x) 最小值所在点对应的自变量值随便猜一个值
float x0 = 1.233;//这个你随便设(由于是弧度所以不要太大)
while (abs(g(x0)) > 0.001) // 一直迭代直到g(x0)接近0
{
// 2. 令切线函数值y = 0求得一个x值,将它作为一个新的猜测值修正原先的猜测x0
float new_x0 = x0 - g(x0) / dg_dx(x0);
x0 = new_x0;
}
cout << "我们自己写的牛顿法求得的arcsin(0.233)=" << x0 << endl;
// 我们用c++自带的arcsin检验下
cout << "c++自带的arcsin求得的arcsin(0.233)=" << asin(0.233) << endl;
return 0;
}