SPSS建模数据分析实战之银行信用评分.

获取数据

数据可以是自己爬取,也可以是其它方式获取,不多说。

数据的特征提取和数据清洗

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116192233803.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
在SPSS Modeler 中导入数据并利用特征模型对原数据进行特征分析。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116192952361.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
可以得出重要的字段和不重要的字段。

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116193045742.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
对136个重要字段进行数据审核,可以看出字段有无缺失值、异常值,。。

~~

然后对数据根据个人需求进行数据清洗。

分析方法:连续变量分箱方法;logistics回归;评分卡方法。

*对字段进行分享计算WOE值
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194048632.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194440964.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194458832.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)

建立模型

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195059204.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)

导出模型方程为TXT文本

![在这里插入图片描述](https://img-blog.csdnimg.cn/2019011619532529.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
**

导出回归系数**

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195409787.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
根据之前导出的方程模型进行计算

将回归系数转化成信用评分

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195521933.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
根据上一步得出的回归系数计算各分箱评分
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195648942.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)

信用模型检验

![在这里插入图片描述](https://img-blog.csdnimg.cn/2019011619575741.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195848205.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
导出八万条客户的评分数据。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116200354328.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
可以看出K-S值最大的是267分,说明如果267分以上放贷,以下不放,可以有拒绝49.592%的坏顾客,同时也会拒绝31.247%的好客户。。

模型验证示例

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116210726765.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
到此就结束,人懒,细节的地方就不写了。因为纯属是为了学习,所以模型最后的结果不是很让人满意,但是大致上了解了SPSS Modeler 的操作。。

在这里插入图片描述

posted @ 2021-07-06 17:11  老酱  阅读(398)  评论(0编辑  收藏  举报