测试数据——猜想大验证(3)

有数据,不妨测试一下,非常有趣:

1.各个信用等级的逾期率

image

其他的都比较符合预期,但A的偏高,我也很纳闷,把数据调出来,从高到低排是这样的:

image

借的量巨大,一旦逾期,在整个逾期率的计算中必然拖累整体。加上A标总数比较少,这个效应就更加明显了。看来数据没啥毛病。将来对选择标的进行模拟时,如果加上金额限制,同样没啥问题。如限制借款上限为6000,则逾期率就降低很多:

image

2.性别,女人比男人靠谱

image

3.借期,6月和12月是主体,但6月明显逾期率低。是不是借期短就意味着借的时候对还款就心中有数呢?

image

4.年龄

20+:image

30+:image

40+:image

50+:image

5:各种认证

征信:image

学历:image

 

实在太多,懒得贴了。还有复杂的条件,写sql语句查实在费劲,不过现在可以在星文快投上随意组合,设置完立刻看结果,有兴趣可以慢慢研究。

posted @ 2017-08-28 17:26  jetz  阅读(135)  评论(0编辑  收藏  举报