多变量梯度下降
Hypothesis: hθ(x)=θTx=θ0+θ1x1+θ2x2+...+θnxn
参数(Parameters): θ1,θ2,θ3,...,θn
可以用Θ向量表示上面的一系列值
损失函数(Cost function): J(θ1,θ2,θ3,...,θn)=12mm∑i=1(hθ(x(i))−y(i))2
当用Θ表示时,损失函数:J(Θ)=12mm∑i=1(hθ(x(i))−y(i))2
梯度下降算法表示为:
重复(repeat){
θj:=θj−α∂∂θjJ(θ1,θ2,θ3,...,θn) (simultaneously update for every j = 0,...,n)
如果用Θ表示 θj:=θj−α∂∂θjJ(Θ) (对于 j = 0,...,n,同时更新)
}
现在看以下部分怎么算 ∂∂θjJ(θ1,θ2,θ3,...,θn)
当n=1时
算法为:
repeat {
θ0:=θ0−α1mm∑i=1(hθ(x(i))−y(i))⏟∂∂θ0J(θ)
θ1:=θ1−α1mm∑i=1(hθ(x(i))−y(i))x(i)
(simultaneously update θ0, θ1)
}
当n>=1时
算法为:
repeat {
θj:=θj−α1mm∑i=1(hθ(x(i))−y(i))x(i)j
(simultaneously update θj for j = 0,..., n)
}
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步