多元线性回归

 

设:n为特征数量,m为样本数量,x(i)为向量,就是一个样本的所有特征

现在我们的特征数量变多了,预测式自然也改变了 变为

唯度都为n+1

那么预测公式就为

代价函数为

我们约定x_0=1,那么当特征数量(n>=1)时,我们进行下面这个公式进行梯度下降,直到收敛

{

j=(0,1,2,3,......,n)

}

但是这样有的时候我们会遇到麻烦,在特征的大小差别很大的时候,梯度下降速度会十分的慢,所以我们需要用到特征缩放。

特征缩放的目的是使所有的x处于同一范围内,也就是-1<=x<=1(其实非常接近也是可以的),可以对x中的x进行等比例缩放。

均值归一化:xi-ui(为平均数)/s  s为xi的范围(最大值-最小值)

 

对于这么一组数据来说,直线不够吻合,抛物线不符合实际,所以可以试试size的3次方

x1=size,x2=(size)^2,x3=(size)^3

在此时,特征处理就显得尤为重要,因为你看100^3=1000000,1000^3=1000000000,并且对于这组数据x1=size,x2=sqrt(size)可能会更吻合。所以我们在创建模型时有多种特征可选择,选择不听的特征可能会有更好的模型。

 

posted @ 2018-11-27 15:53  fromzore  阅读(259)  评论(0编辑  收藏  举报