LR及评分卡(未完成)

主要分为如下内容:

一、线性回归

二、逻辑回归

三、逻辑回归评分卡流程

 

一、线性回归

二、逻辑回归

在线性回归的基础上引入了sigmoid函数,Logistic回归为什么要使用sigmoid函数

三、逻辑回归评分卡流程

1.y值确定

2.变量分析(缺失值处理(对于不同模型如何处理?)、离散值处理、离群点(对于不同形式的离群点如何处理?业务错误数据,误差数据。))

svm和lr哪个更能对付异常点outlier?

3.特征工程

4.数据预处理:无量纲化(标准化、区间缩放法)、二值化、哑变量

标准化和归一化的区别?lr是否要标准化?

5.分箱、woe转化、iv值

6.变量选择:Filter、Wrapper、Embedded

http://blog.sina.com.cn/s/blog_7103b28a0102w9cx.html

7.训练模型

    a 是否知道首先尝试什么。

如果不知道,首先尝试使用线性​预测器,使用forward selection method进行特征选择,建立一系列使用不同特征的预测器。如果其中对应某个尽可能小特征

集的预测器性能更好,尝试在这个特征集上建立非线性模型。

    b是否有足够的时间、计算资源和数据集,并有一些新的想法,如果是,比较几种不同的特征选择方法,使用线性和非线性模型建模,然后选择效果最好的。

    c是否希望得到一个稳定的模型,如果是,对数据集进行抽样,重复分析过程。

8.模型指标(ROC/KS)

9.转化为评分卡

使用sklearn做特征工程

逻辑回归为何要用sigmoid函数,底层假设有哪些很好的文章

建模中常见误区

如何看待机器学习中LR系数显著性

决策树、id3、c4.5总结

鲁棒性回归(异常值)鲁棒性回归2

 

posted on 2019-08-24 11:42  静静的白桦林_andy  阅读(374)  评论(0编辑  收藏  举报

导航