吴恩达机器学习笔记|（4）过拟合问题及正则化（Overfitting&regularization）

在优化目标函数中加入惩罚项以缩小参数值（\(\lambda\)为正则化参数）

\(\min_\limits{\theta}[\frac{1}{2m}\sum_\limits{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2+{\color{red}\lambda\sum_\limits{j=1}^n\theta_j^2}]\)（一般不会用\(\theta_0\)，但影响不大）
- 更小的参数值意味着更简单的假设函数和更平滑的拟合曲线。
- 但是正则化参数 \(\lambda\) 不能太大，否则相当于只含\(\theta_0\)，会导致欠拟合
例：

如一个有3个参数的目标函数，在其后加入\(\lambda(\theta_3+\theta_4)\)项，且\(\lambda\)很大，则要使整个目标函数最小，必然要让\(\theta_3,\theta_4\)接近0，相当于忽略了这两个参数。

\(\min_\limits{\theta}[\frac{1}{2m}\sum_\limits{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2+{\color{red}\lambda(\theta_3^2+\theta_4^2)}]\)

目标函数

\(\min_\limits{\theta}-\frac{1}{m}\left[\sum_\limits{i=1}^my^{(i)}\log(h_\theta(x^{(i)}))+(1-y^{(i)})\log(1-h_\theta(x^{(i)}))\right]+\frac{\lambda}{2m}\sum_\limits{j=1}^n\theta_j\)
迭代过程

posted @ 2022-08-19 16:50 无发可理的理发师阅读(180) 评论(0) 收藏举报

刷新页面返回顶部

无发可理的理发师