woe、iv、ks的计算和定义
摘要:https://www.cnblogs.com/wqbin/p/10547628.html WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。 要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱等等,说的都是一个意思)。
阅读全文
决策树原理加例子
摘要:网站 1:https://zhuanlan.zhihu.com/p/197476119 #综合 2:https://blog.csdn.net/u010916338/article/details/94653402 #信息增益率 3:https://zhuanlan.zhihu.com/p/4932
阅读全文
模型理论知识
摘要:人工智能:机器学习、对环境的感知、实现动作 机器学习 学习: 2.机器学习三要素:数据、算法、模型 机器学习研究的是从数据中通过选取合适的算法,自动的归纳逻辑或规则,并根据这个归纳的结果(模型)与新数据来进行预测。 3.深度学习是在机器学习的基础上实现的,得益于机器性能的提升。神经网络则是深度学习的
阅读全文
模型评价指标
摘要:准确率、召回率 网址 :https://blog.csdn.net/seagal890/article/details/105059498 True Positive(TP):真正类。样本的真实类别是正类,并且模型识别的结果也是正类。 False Negative(FN):假负类。样本的真实类别是正
阅读全文
逻辑回归思路
摘要:整体建模思路 1、拿到样本先分训练集和测试集,0.7或0.8,根据样本数量考虑是否增加验证集,本次不增加验证集。 2、对训练集样本进行初筛。iv大于0.01,相关系数低于80%,缺失率根据变量中文名无特殊情况,不得高于80%。 3、对训练集先用决策树分6-8箱。此时对变量进行二次筛选。主要考虑变量是
阅读全文
XGB调参思路
摘要:(1)选择较高的学习率,例如learning_rate=0.1,这样可以减少迭代用时。 (2)然后对 (max_depth , min_child_weight) , (3)在第二步确定的基础上调整 gamma , (4)subsample, colsample_bytree 这些参数进行调整。 (
阅读全文