【CV】吴恩达机器学习课程笔记 | 第7章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片
机器学习 | Coursera
吴恩达机器学习系列课程_bilibili
7 正则化
7-1 过拟合问题
- 上图左侧坐标系为欠拟合,用一条直线不能很好的表示这个数据集,偏差很大
- 上图中间为合适的拟合
- 上图右侧为过度拟合,拟合的曲线波动很大,假定函数中的变量过多,虽然代价函数非常接近0,但不能泛化到其他数据集中
- 上图为在逻辑回归中的欠拟合、合适的拟合、过度拟合
解决过拟合:
1.减少特征数量
2.正则化
7-2 (正则化更改)代价函数
使用正则化更改代价函数
- 直接使用上图右侧的假定函数及其代价函数会导致过拟合
- 在不去掉 θ 3 θ_3 θ3和 θ 4 θ_4 θ4的前提下,可以在代价函数上加上对于 θ 3 θ_3 θ3和 θ 4 θ_4 θ4的惩罚项: 1000 θ 3 2 + 1000 θ 3 2 1000θ_3^2+1000θ_3^2 1000θ32+1000θ32,(1000只是随便一个比较大的数),加上惩罚项之后的代价函数在运算中会让参数 θ 3 θ_3 θ3和 θ 4 θ_4 θ4变得尽可能小,让 θ 3 θ_3 θ3和 θ 4 θ_4 θ4对假定函数的图像影响变小,这样就可以在保留 θ 3 θ_3 θ3和 θ 4 θ_4 θ4参数的情况下不产生过拟合。
加上惩罚项后的假定函数变为:
J
(
θ
)
=
1
2
m
[
∑
i
=
1
m
C
o
s
t
(
h
θ
(
x
(
i
)
)
,
y
(
i
)
)
+
1000
θ
3
2
+
1000
θ
3
2
]
J(θ)=\frac{1}{2m} \left[ \sum_{i=1}^mCost(h_θ(x^{(i)}),y^{(i)})+1000θ_3^2+1000θ_3^2 \right]
J(θ)=2m1[i=1∑mCost(hθ(x(i)),y(i))+1000θ32+1000θ32]
由于我们一般不知道哪一项会导致过拟合,所以在代价函数中加入正则化项
加入后的代价函数为:
J
(
θ
)
=
1
2
m
[
∑
i
=
1
m
C
o
s
t
(
h
θ
(
x
(
i
)
)
,
y
(
i
)
)
+
λ
∑
j
=
1
n
θ
j
2
]
J(θ)=\frac{1}{2m} \left[ \sum_{i=1}^mCost(h_θ(x^{(i)}),y^{(i)})+λ\sum_{j=1}^{n}θ_j^2 \right]
J(θ)=2m1[i=1∑mCost(hθ(x(i)),y(i))+λj=1∑nθj2]
λ
λ
λ为正则化参数,一般不对
θ
0
θ_0
θ0增加惩罚项,所以
j
j
j从
1
1
1开始
7-3 线性回归的正则化
- 正则化后的梯度下降循环项如上图,由于在代价函数中没有添加对
θ
0
θ_0
θ0的惩罚项,所以对
θ
0
θ_0
θ0的更新分开表示
- 对于 j = 1 , 2 , 3 , . . . , n j=1,2,3,...,n j=1,2,3,...,n的梯度下降项也可化简为上图的式子
- 可以得到 1 − α λ m 1-α\frac{λ}{m} 1−αmλ是一个小于1但非常接近1的数
使用正则化后得到的正规方程为:
- 这里只要 λ > 0 λ>0 λ>0,那么括号内计算得出的矩阵一定可逆
- 而在原来没有用正则化得出的正规矩阵 θ = ( X T X ) − 1 X T y θ=(X^TX)^{-1}X^Ty θ=(XTX)−1XTy中,如果 m < n m<n m<n(m为样本数,n为特征数),那么括号内矩阵不可逆(是奇异矩阵),所以正则化也可以应用于样本数小于特征数时的情况,让括号内矩阵可逆
7-4 逻辑回归的正则化
正则化后逻辑回归的代价函数改为:
J
(
θ
)
=
−
1
m
[
∑
i
=
1
m
y
(
i
)
l
o
g
(
h
θ
(
x
(
i
)
)
)
+
(
1
−
y
(
i
)
)
l
o
g
(
1
−
h
θ
(
x
(
i
)
)
)
]
+
λ
2
m
∑
j
=
1
n
θ
j
2
J(θ)=-\frac{1}{m}\left[\sum_{i=1}^my^{(i)}log(h_θ(x^{(i)}))+(1-y^{(i)})log(1-h_θ(x^{(i)}))\right]+\frac{λ}{2m}\sum_{j=1}^{n}θ_j^2
J(θ)=−m1[i=1∑my(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))]+2mλj=1∑nθj2
正则化后的梯度下降循环项如上图
本文来自博客园,作者:Fannnf,转载请注明原文链接:https://www.cnblogs.com/overtop/p/15890732.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)