多变量梯度下降
Hypothesis: hθ(x)=θTx=θ0+θ1x1+θ2x2+...+θnxn
参数(Parameters): θ1,θ2,θ3,...,θn
可以用Θ向量表示上面的一系列值
损失函数(Cost function): J(θ1,θ2,θ3,...,θn)=12mm∑i=1(hθ(x(i))−y(i))2
当用Θ表示时,损失函数:J(Θ)=12mm∑i=1(hθ(x(i))−y(i))2
梯度下降算法表示为:
重复(repeat){
θj:=θj−α∂∂θjJ(θ1,θ2,θ3,...,θn) (simultaneously update for every j = 0,...,n)
如果用Θ表示 θj:=θj−α∂∂θjJ(Θ) (对于 j = 0,...,n,同时更新)
}
现在看以下部分怎么算 ∂∂θjJ(θ1,θ2,θ3,...,θn)
当n=1时
算法为:
repeat {
θ0:=θ0−α1mm∑i=1(hθ(x(i))−y(i))⏟∂∂θ0J(θ)
θ1:=θ1−α1mm∑i=1(hθ(x(i))−y(i))x(i)
(simultaneously update θ0, θ1)
}
当n>=1时
算法为:
repeat {
θj:=θj−α1mm∑i=1(hθ(x(i))−y(i))x(i)j
(simultaneously update θj for j = 0,..., n)
}
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 智能桌面机器人:用.NET IoT库控制舵机并多方法播放表情
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 开发者新选择:用DeepSeek实现Cursor级智能编程的免费方案
· Tinyfox 发生重大改版
· 独立开发经验谈:如何通过 Docker 让潜在客户快速体验你的系统
· 小米CR6606,CR6608,CR6609 启用SSH和刷入OpenWRT 23.05.5
· 近期最值得关注的AI技术报告与Agent综述!