萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第二节 线性回归算法 (上)理解篇
理解
以a b为变量,预测值与真值的差的平方和为结果的函数 参数学习的基本方法:找到最优参数使得预测与真实值差距最小
假设可以找到一条直线 y = ax+b 使得预测值与真值的差的平方和最小
故事
假设你面前有一堆男人
这些男人的基本信息全部掌握,包括他们的年收入
简单线性回归
简单线性回归的思想就是:假设你相信,这些男人的身高越高,年收入越高,然后找到一个一元线性方程 ,让这个方程猜得最准,然后 把这个方程记下来,以后见到男人 就看身高,知道身高就猜他的年收入
多元线性回归
多元线性回归的思想就是:假设你相信,这些男人的身高越高,年收入越高(或者越低),同家里房子的数量越多,年收入越高,等等等等 然后找到多元线性方程 ,让这个方程猜得最准,然后 把这个方程记下来,以后见到男人 就看身高 家里几套房等等你之前相信的东西,知道身高就猜他的年收入
何谓猜得准
损失函数
你在不断尝试找寻真命天子函数过程中,预测的值和 真实值的差距,常用方法是MSE,比如 你猜他收入10w一年,结果他是0收入,那么对于这个男的 误差就是10w,把这些误差的平方和加起来就构成了一个简单的损失,损失越小猜得越准