LR及评分卡（未完成）

主要分为如下内容：

一、线性回归

二、逻辑回归

三、逻辑回归评分卡流程

一、线性回归

二、逻辑回归

在线性回归的基础上引入了sigmoid函数，Logistic回归为什么要使用sigmoid函数

三、逻辑回归评分卡流程

1.y值确定

2.变量分析（缺失值处理(对于不同模型如何处理？）、离散值处理、离群点（对于不同形式的离群点如何处理？业务错误数据，误差数据。））

3.特征工程

4.数据预处理：无量纲化（标准化、区间缩放法）、二值化、哑变量

5.分箱、woe转化、iv值

6.变量选择：Filter、Wrapper、Embedded

http://blog.sina.com.cn/s/blog_7103b28a0102w9cx.html

7.训练模型

a 是否知道首先尝试什么。

如果不知道，首先尝试使用线性预测器，使用forward selection method进行特征选择，建立一系列使用不同特征的预测器。如果其中对应某个尽可能小特征

集的预测器性能更好，尝试在这个特征集上建立非线性模型。

b是否有足够的时间、计算资源和数据集，并有一些新的想法，如果是，比较几种不同的特征选择方法，使用线性和非线性模型建模，然后选择效果最好的。

c是否希望得到一个稳定的模型，如果是，对数据集进行抽样，重复分析过程。

8.模型指标（ROC/KS）

9.转化为评分卡

posted on 2019-08-24 11:42 静静的白桦林_andy 阅读(374) 评论(0) 编辑收藏举报

刷新页面返回顶部

静静的白桦林