测试数据——有效范围(2)
测试数据库搞好,学习了一下逾期率的官方定义:
• 对于某支标,如果某一期没有正常还款,则悲观逾期率=所有未还本金/借款本金;
• 对于一批标,悲观逾期率=当前逾期标的所有未还本金/借款本金;
• 以30天逾期率为例,\30+"悲观逾期率=当前逾期30天以上标的未还本金/所有标的本金之和。
库里数据统计日期是17.2.22,有5万多个标是1.22之后的,也就是说,还未到首次还款时间,剔除之。
然后计算了一下,库中27万笔数据的逾期率:
select sum(wh)/sum(amount) from l3
结果,很受伤,高达33%:
把数据分开,按月统计标的数量和逾期率,结果:
这个就比较容易理解了,时间越往后逾期率越高,而1年前以及更早的标的,逾期率趋于稳定。我理解是逾期并非一出现就铁定逾期,随着时间的推移可能还会还。所以,比较接近真实的逾期率,应该是经过一段时间沉淀后的逾期率。这个和一些高手告知的经验也比较吻合。
尽管后面的数据肯定有用,但我的目的只是要一个相对可参考的逾期率,所以,我把样本选在了1年前的数据,即2015年3月以前的数据。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步