梯度下降

1.梯度下降(单，多元)

2.特征缩放

3.选择合适的α（学习率）

4.特征和多项式

梯度下降是很常用的算法，不仅用于线性回归，还广泛应用于机器学习的众多领域，可以最小化其他函数（任意函数）

不同的起始点有可能得到不同的局部最优解

下图Θ逐渐减小，直到最佳状态

可能会出现的问题

随着导数斜率越来越小，下降的越来越慢

多特征的时候

单个特征对比多个特征（多元线性回归）

特征缩放（将特征的值转换为相近似的范围）

也可以运用均值归一化

如何选择合适的α（学习率）

不同问题的梯度下降达到收敛的迭代次数不同（最好可以通过看对应图来观察是否收敛）

α过大的话可能会出现J（α）异常上升或者波动的情况，解决办法就是减小α，但是α不能太小（不然下降会特别慢）

try 0.001, 0.01 , 0.1 等等 0.003 ，0.03 ， 0.3....等等都行

特征和多项式

多次项拟合程度不好的话，可以试一试选择不同的特征，有时可以得到更好的模型

posted @ 2021-11-26 15:51 磕伴阅读(68) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构
· 字符编码：从基础到乱码解决
· 提示词工程——AI应用必不可少的技术

昵称：磕伴
园龄： 3年9个月
粉丝： 0
关注： 1

2025年3月

日

一

二

三

四

五

六

磕伴