测试数据——猜想大验证（3）

有数据，不妨测试一下，非常有趣：

1.各个信用等级的逾期率

其他的都比较符合预期，但A的偏高，我也很纳闷，把数据调出来，从高到低排是这样的：

借的量巨大，一旦逾期，在整个逾期率的计算中必然拖累整体。加上A标总数比较少，这个效应就更加明显了。看来数据没啥毛病。将来对选择标的进行模拟时，如果加上金额限制，同样没啥问题。如限制借款上限为6000，则逾期率就降低很多：

2.性别，女人比男人靠谱

3.借期，6月和12月是主体，但6月明显逾期率低。是不是借期短就意味着借的时候对还款就心中有数呢？

4.年龄

20+：

30+：

40+：

50+：

5：各种认证

征信：

学历：

实在太多，懒得贴了。还有复杂的条件，写sql语句查实在费劲，不过现在可以在星文快投上随意组合，设置完立刻看结果，有兴趣可以慢慢研究。

posted @ 2017-08-28 17:26 jetz 阅读(148) 评论(0) 收藏举报

刷新页面返回顶部