LR及评分卡(未完成)
主要分为如下内容:
一、线性回归
二、逻辑回归
三、逻辑回归评分卡流程
一、线性回归
二、逻辑回归
在线性回归的基础上引入了sigmoid函数,Logistic回归为什么要使用sigmoid函数
三、逻辑回归评分卡流程
1.y值确定
2.变量分析(缺失值处理(对于不同模型如何处理?)、离散值处理、离群点(对于不同形式的离群点如何处理?业务错误数据,误差数据。))
3.特征工程
4.数据预处理:无量纲化(标准化、区间缩放法)、二值化、哑变量
5.分箱、woe转化、iv值
6.变量选择:Filter、Wrapper、Embedded
http://blog.sina.com.cn/s/blog_7103b28a0102w9cx.html
7.训练模型
a 是否知道首先尝试什么。
如果不知道,首先尝试使用线性预测器,使用forward selection method进行特征选择,建立一系列使用不同特征的预测器。如果其中对应某个尽可能小特征
集的预测器性能更好,尝试在这个特征集上建立非线性模型。
b是否有足够的时间、计算资源和数据集,并有一些新的想法,如果是,比较几种不同的特征选择方法,使用线性和非线性模型建模,然后选择效果最好的。
c是否希望得到一个稳定的模型,如果是,对数据集进行抽样,重复分析过程。
8.模型指标(ROC/KS)
9.转化为评分卡
逻辑回归为何要用sigmoid函数,底层假设有哪些很好的文章
posted on 2019-08-24 11:42 静静的白桦林_andy 阅读(374) 评论(0) 编辑 收藏 举报