测试数据——猜想大验证(3)
有数据,不妨测试一下,非常有趣:
1.各个信用等级的逾期率
其他的都比较符合预期,但A的偏高,我也很纳闷,把数据调出来,从高到低排是这样的:
借的量巨大,一旦逾期,在整个逾期率的计算中必然拖累整体。加上A标总数比较少,这个效应就更加明显了。看来数据没啥毛病。将来对选择标的进行模拟时,如果加上金额限制,同样没啥问题。如限制借款上限为6000,则逾期率就降低很多:
2.性别,女人比男人靠谱
3.借期,6月和12月是主体,但6月明显逾期率低。是不是借期短就意味着借的时候对还款就心中有数呢?
4.年龄
5:各种认证
实在太多,懒得贴了。还有复杂的条件,写sql语句查实在费劲,不过现在可以在星文快投上随意组合,设置完立刻看结果,有兴趣可以慢慢研究。