2024/1/26学习进度笔记
特征缩放
特征缩放:将不同特征的值量化到同一区间的方法。
简单来说就是将原本由于单位不同而导致数值范围上存在较大差异的特征放到同一个数值区间内。
特征的数值范围差异较大,在采用欧式距离来衡量两个特征间的距离时,就会导致最终距离仅取决于取值范围跨度最大的特征。举个例子。
假设我们要从身高特征和年龄特征来区分两个人,其中我们根据常识可以知道年龄的取值范围为 [1, 100],身高的取值范围在 [0.4, 2.5] (单位:m)。那么按照欧式距离计算,特征间的距离严重取决于年龄的影响,而身高对两者的距离影响极小,也就是说即便我们对两个特征同时考察,实际上我们无意识地仅考察了一个影响因素,这在模型训练中是致命的。
而导致类似身高、体重、年龄这些不同特征的取值范围不同的原因就是他们的单位不同。
另一方面,对于没有进行特征缩放的训练集使用梯度下降法训练时,会导致迭代次数增加的情况。
通过图片我们可以很直观地看出,在使特征相近区域内(不一定要相同)有助于减少提高梯度下降法的迭代次数,从而提升模型训练速度,使模型更快地收敛。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通