测试数据——有效范围(2)

 

测试数据库搞好,学习了一下逾期率的官方定义:

• 对于某支标,如果某一期没有正常还款,则悲观逾期率=所有未还本金/借款本金;

• 对于一批标,悲观逾期率=当前逾期标的所有未还本金/借款本金;

• 以30天逾期率为例,\30+"悲观逾期率=当前逾期30天以上标的未还本金/所有标的本金之和。

库里数据统计日期是17.2.22,有5万多个标是1.22之后的,也就是说,还未到首次还款时间,剔除之。

 

然后计算了一下,库中27万笔数据的逾期率:

select sum(wh)/sum(amount) from l3

结果,很受伤,高达33%:

image

把数据分开,按月统计标的数量和逾期率,结果:

image

这个就比较容易理解了,时间越往后逾期率越高,而1年前以及更早的标的,逾期率趋于稳定。我理解是逾期并非一出现就铁定逾期,随着时间的推移可能还会还。所以,比较接近真实的逾期率,应该是经过一段时间沉淀后的逾期率。这个和一些高手告知的经验也比较吻合。

尽管后面的数据肯定有用,但我的目的只是要一个相对可参考的逾期率,所以,我把样本选在了1年前的数据,即2015年3月以前的数据。

posted @ 2017-08-28 16:43  jetz  阅读(195)  评论(0编辑  收藏  举报