计算之道

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2024年1月3日

摘要: 通过结合方差阈值、特征相关性分析、单因素统计测试、递归特征消除和特征重要性等特征选择方案,在减少特征数量的同时,最大限度地保留对目标变量的关键信息,从而提升模型的效率、可解释性,并防止过度拟合的发生。 一、特征相关性分析 计算各个特征之间的相关性(可用皮尔逊相关系数)。如果有相关系数较高的两个特征, 阅读全文
posted @ 2024-01-03 15:16 计算之道 阅读(32) 评论(0) 推荐(0) 编辑

摘要: 一、特征缩放的定义,原因 特征缩放(feature scaling)是在机器学习中常用的数据预处理步骤,是数据预处理步骤中及其容易被忽略的一步。 为什么要特征缩放?考虑一下 kNN 算法,如果我们有两个特征,特征 A 的取值范围在 [1,10],特征 B 的取值范围在 [1, 100000]。那么在 阅读全文
posted @ 2024-01-03 10:47 计算之道 阅读(106) 评论(0) 推荐(0) 编辑