05-评分决策模型

5.评分决策模型

模型是策略流程中非常重要的一个环节：可以直接根据评分卡分数拒绝掉一部分客户，或着根据分数走不同的审批流程、使用不同的额度策略。

那么问题就在于，这个划分的切点到底应该定在哪里？到底违约概率高到什么程度的客户需要走人工电核？这个问题，可不是等频或等距切分就可以简单解决，下面介绍三种量化的方法。

通过违约率和通过率切分可以说是最简单方法了，但是前提是已经有一个确定好的违约率or通过率。比如说，希望会有30%的客户通过，那就可以找全量样本（需要是无偏的）的分数30%分位数的水平，作为一个切分标准；或者说希望违约概率在5%以上的样本直接拒绝，那就寻找5%违约概率对应的分值即可。

KS(Kolmogorov-Smirnov)值衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大，KS指标越大，那么模型的风险区分能力越强。

KS的计算步骤如下：

（1）按照模型的结果对每个账户进行打分；

（2）所有账户按照评分排序，从小到大分为10组（或20组）

（3）计算每个评分区间的好坏账户数。

（4）计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。

（5）计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值（累计bad%-累计good%），然后对这些绝对值取最大值即得此评分模型的K-S值。

如上图所示，模型的KS值为65.57。按照KS值的算法，分组分的越多，KS值越大，最大的时候是将每一个账户当作一个分组。

模型的KS值有一些行业内的规范，一般要达到20以上才是一个可用的模型，但就效果来讲，KS值是越高越好。然而，过高又使人怀疑是否有使用未来变量的嫌疑，着实需要注意。

模型决策的过程通常是精准率和召回率的权衡，其中精准率precision = TP / (TP + FP)，即被判定为坏中实际为坏的比例；召回率recall = TP / (TP + FN)，即有多少坏样本被判断为坏样本，简单点说就是累计坏样本率。

而F-score，就是一个综合考虑了精准率和召回率的指标，是它们的加权调和平均值：

其中β是一个用于调整精准率和召回率权重的指标，在下面的例子中我们取β=1，认为两者权重是相等的。

可以看到在600分的时候，F-score取到了最大值，意味着这是在该衡量标准下最有效的切分点。

posted on 2023-07-05 14:54 一只小白two 阅读(256) 评论(0) 收藏举报

刷新页面返回顶部