摘要: 1.哪些机器学习算法不需要做归一化处理? 概率模型不需要归一化,因为它们不关心变量的值,而是关心变量的分布和变量之间的条件概率, 如决策树、RF。 而像Adaboost、GBDT、XGBoost、SVM、LR、KNN、KMeans之类的最优化问题就需要归一化。 2. 为什么XGBoost要用泰勒展开 阅读全文
posted @ 2020-07-16 22:41 西伯尔 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 一、概述 1.处理方法总结 (1)不平衡数据集 通常情况下通常情况下把多数类样本的比例接近100:1这种情况下的数据称为不平衡数据。不平衡数据的学习即需要在分布不均匀的数据集中学习到有用的信息。 (2)不平衡数据集的处理方法主要分为两个方面 1、从数据的角度出发,主要方法为采样,分为欠采样和过采样以 阅读全文
posted @ 2020-07-16 21:35 西伯尔 阅读(1850) 评论(0) 推荐(0) 编辑