评分模型的检验方法和标准&信用评分及实现

评分模型的检验方法和标准通常有：K-S指标、交换曲线、AR值、Gini数等。例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成功的应用价值。K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

评分模型的检验方法和标准通常有：K-S指标、交换曲线、AR值、Gini数等。例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成功的应用价值。K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成功的应用价值。K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

信用评分模型介绍（一）

2016-08-28 蒋靓 Larry Jiang Larry的风险模型分享与探讨

引言：对于信用评分模型，很多朋友或多或少有所了解，这里做一般性的介绍，并分享自己的多年从业经验。这边短文主要包括：信用评分模型，自变量的生成、筛选、分档和转换，及常用有监督学习模型。

信用评分模型

信用评分模型是一种有监督的学习模型（Supervised Learning），数据由一群自变量X和对应的因变量y构成。传统零售信用模型中，X大致分为客户的基本信息（年龄、性别、职业、学位等），财务信息（收入，每月生活消费，每月信贷还款额等），产品信息（LTV，信用卡类别，个人贷款用途等），征信信息（前6个月被查询次数，前6个信用卡最大利用率，未结清贷款数等）；而一般取值0-1因变量y可以定义为在未来12个月是否出现欠款90天等.

经验备注：在大数据下，很多互联网公司对个人的评估不再局限于以上几种信息，而是根据更为广泛的数据源对个人进行更全面的刻画，故有称之为客户画像。数据维度会考虑个人在社会上留下的任何数据，如手机使用行为，理财行为，社交圈，网购行为，旅游行为等等等等。大家的各方面数据其实都在被不同的公司和不同的APP收集。。。

自变量的生成

自变量是信用风险的来源，除了考虑直接收集的变量，信用评分建模过程中往往需要建模人员产生更多的衍生变量。这部分工作要分析人员的直觉、长期经验的积累和数据挖掘技术的应用。大家可以通过京东和支付宝的评分一窥其自变量的维度：芝麻信用分为5个维度：身份特质，履约能力，信用历史，人脉关系，行为偏好；小白信用分也分为5个维度：身份，资产，关系，履约，偏好。

经验备注：现在越来越多的模型技术被应用于信用模型，但是个人觉得无论高级模型还是初级模型，最为重要的是更广泛的数据和产生更多更具有预测能力的自变量。

自变量的筛选

自变量一旦丰富了起来，就涉及到有效变量的筛选，大致可根据一下几个原则或方法：变量的直观意义（是否跟y有关），变量的单调性或合理性，未来是否可以获取以便模型可实施，变量的区分能力（IV），变量间相关性（变量聚类），变量缺失率，分档之后的稳定性等等。

经验备注：对于区分能力太强的变量，或缺失率很大的变量，不建议直接放入模型，可以考虑做成规则或者做成最后模型的调整。在大数据下，人们经常强调自变量与因变量的相关关系，应用于精准性要求不高的营销模型问题不大。而对于精准度要求极高的信用评分模型，相关关系的应用值得推敲。

自变量分档和转换

为了保持模型的稳定性，信用模型一般对自变量进行分档，比如根据风险不同把年龄分成几档。这样每档需要一个值来代表这段的自变量输入，这就是变量的转换，常见的有WOE和Logit转换。通过转换后不仅实现了稳定性要求，也克服不同变量间刻度不统一的问题，还克服回归中缺失值的填充问题。

经验备注：如果分档过粗糙，不但会降低单个变量的预测能力，也会造成最终评分集中度过高的问题。

解决方法：可以考虑每档用线性插值来代替常数，也可以寻找更多能区分分数集中样本的自变量放入模型。

有监督学习模型介绍

目前比较流行的模型主要有以下几种（以后分享会逐一介绍）：

Logistic 回归（Logistic Regression）
决策树（Decision Tree）
支持向量机（Support Vector Machine）
人工神经网络（Artificial Neural Network）
生存分析模型（Survival Analysis Model）

经验备注：除此上述之外，还有些高级方法或算法：集成方法（Ensemble Method）（例如随机森林（Random Forrest），Boosting，AdaBoost），深度学习方法（Deep Learning），随机梯度下降算法（Stochastic Gradient Descent）等。

信用评分及实现

1、何为信用评级?

首先，何为“信用”?俗话“有借有还”从道德上对信用进行了定义，然后银行与其客户之间“借贷”的关系，往往较为复杂。通常，银行需要全方位、多角度地去评价客户，确认客户的“信用”，才能放心地把钱“借”出去。

我们都熟悉支付宝芝麻信用分，它是通过采集个人用户信息，经过加工、计算得出用户的信用得分，当然，分数越高代表信用越好。

这几个维度包含了用户个人基本信息、好友互动信息、信用账户情况及履约历史、购物及理财等行为偏好等多项内容，通过大数据技术，最终以分数值的形式，形成对用户信用的准确评价。这就是信用评级。

随着数学和统计技术在传统金融行业的广泛应用和推广，银行业也采用了“定量”的形式，多角度分析、判断不同客户的不同的信用等级，从而来决定客户可获取的授信额度、首付额度或利率优惠程度等，以科学手段准确地计量客户的“信用”，从而避免因借贷双方信息不一致而引发的信用风险损失。

2、信用评级的基础：数据

现如今，早已不是拨打算盘手工记账的年代，社会上任何活动都拖离不了信息系统，当然，这些信息系统中，也无时不刻地记录着你的所有行踪，这就是所谓的“数据”。对这些数据的存储、清洗、加工，都为银行对客户信用评级提供了健全、丰富的信息来源;基于此，银行以大数据技术进行分析和计算，从而准确地对客户进行信用评价。

银行进行客户信用评级的数据来源于银行内部系统产生的数据或外部的数据，如图示：

内部数据

从客户的第一次开户开始，其与银行的每一次交互都将银行的信息系统留存，例如存款、转账、还信用卡、还贷、销户或购买理财等，每一次活动的时间、方式、地点、账户、金额、交易对象等等，都完整的保存在银行的数据库中。这些积累的数据，是银行非常宝贵的资产。与客户评级相关的数据，通常包括以下几个方面：

1)客户基本数据：银行通过不同形式、不同时间、不同地点所记录的客户名称、证件编号、联系方式、营收情况、学历、就业情况、客户关联人信息等;

2)贷款或信用卡账户信息：包括账户号码、余额、开销户时间、额度、额度调整历史等;

3)交易历史：即贷款放款、还款计划及实际还款、现金提取、信用卡刷卡、还卡、换卡等各类事件的具体时间、地点、方式等详细记录;

4)担保信息：即贷款抵押物基本信息、估值或评级信息，担保人信息等。

除上述外，信用卡或贷款产品的营销活动等数据，也与客户评级有关。

外部数据

外部数据来源广泛，以人行征信数据为例，其包含了客户基本信息，如姓名、性别、证件编号、婚姻情况、联系方式、住址等等;借款人的信用历史，如逾期情况、贷款尚未结清信息、担保信息、异常交易信息等;还有一些个人非银行信息，如住房公积金信息、社保信息等。

目前，各家银行都已经建立ODS或数据仓库等数据平台，其包含的信息能满足银行各条线的业务需要，为开展各类管理、经营决策的提供数据基础。然而，客户信用评级数据作为数据平台的一部分，通常混合于其他数据之中，因此，有必要仅针对信用风险管理或信用评级的需要，面向信用风险管理应用开发，单独建立信用风险数据集市。

数据来源于各类生产、业务系统，经由数据仓库，进入信用风险数据集市中。风险数据集市则按照上层应用的需要，进行数据的整合和存储。一般来说，信用风险相关的数据经过拆分、拼装或重组，以主题的形式存储在信用风险数据集市中。通常，包含以下几个主题：

3、信用评分的实现：模型开发

数据挖掘是从大量的、有噪音的数据中，发现潜在的规律和价值，以辅助提高管理、决策能力。银行通过对外部数据及信贷等业务中产生的数据进行提炼、分析，开发模型，对客户进行信用评分，以服务于信贷管理，增强风险控制能力。

第一步：样本抽取

银行积累的客户评级相关的数据量极其庞大，出于数据处理速度及模型开发效率的考虑，通常抽取一定量的数据作为样本，开发模型。常用的样本选择方式有两种，随机抽样和分类抽样。随机抽样较为交单，即随机选择样本，认为样本可以代表整体情况。例如，总贷款账户数是5000，不良贷款账户数是100，占比1/50;那么随机抽取100个贷款账户，其中包含2个不良贷款账户。而分类抽样，则需要先分类，确认各类样本的数据量，再分别进行随机抽样。例如上述例子中的账户样本选择，首先据担保情况进行分类，有无担保比例分别为3:2，则再分别随机抽取60个有担保的不良贷款账户和40个无担保的不良贷款记录。

当然，以上仅为示例，实际情况却往往复杂很多。

第二步：变量选择

明确因变量和自变量。其中因变量为表现变量，即模型的结果“客户信用情况”;自变量为与之相关的因素，它的预测能力决定于它与因变量之间相关关系和逻辑因果关系。通常，与信用等级相关的因素包含客户的学历、工资、年龄、额度使用情况、现金提取次数、还款时间等。

第三步：模型分组

模型分组的意义在于区分不同行为模型和数理关系，以提高模型预测的精准度。例如，学生和在职人员的还款能力是有差异的，但是某类自变量和坏账率的表现上，趋势十分相似，所以讲模型分组，将避免相互之间的模型因素的干扰和影响。

第四步：模型设计

影响模型结果的变量非常复杂，因此需要根据单个变量的实际预测能力进行筛选，剔除没有预测能力的变量，以缩小变量的范围。

常见的模型算法有线性回归分析、非线性回归分析、逻辑回归模型、神经网络模型、决策树模型等。在实际的模型选择过程中，需根据模型性质、分析人员经验等多方面因素综合考量。

第五步：模型检验

模型检验，在于衡量开发的信用评分模型能力。常用的检验报告有以下几类：

交换曲线
K-S指标
区分度
拟合度曲线

其中，前三者表现的效果为：“评分越高，则好账户出现的越多”;而拟合度曲线，则用于对比预测情况与实际情况差异。

写在最后

信用评分对银行的经营效益有着重要的作用，信用评分模型应用效果，很大程度上也取决于银行的内部管理及信贷政策。技术和管理相结合，双管齐下，一定是控制客户信用风险的最优方案。

End.

转自：http://www.36dsj.com/archives/75665

posted @ 2017-02-04 13:46 Little_Rookie 阅读(21634) 评论(0) 收藏举报

刷新页面返回顶部