数据分析九:互联网征信中的信用评分模型(用户APP使用行为分析)

用户APP使用行为数据分析:
一. 背景及数据介绍:
1. 移动互联网发展背景: 网民规模7.72亿,手机网民规模7.53亿;
2. APP使用热点:
商务交易类应用规模高速增长(网络购物,网上外卖,在线旅行);
互联网理财用户规模达到1.29亿,同比增长20%;
公共服务类各细分领域规模增长(在线教育,网约车,共享单车)
3. APP数据优势:覆盖面广,范围广;渗透生活方方面面;适用人群多样;
4. 数据类型:基本属性信息包括性别/年龄/省份/手机价格;手机号对应的APP安装记录;

5. 补充数据:根据APP名称去安卓市场爬取APP的详细描述(关于名称无法确定是做什么的app,通过app市场了解);

6. 样本量:建模样本,共1000个用户,好人800个,坏人200个;

二. 变量构建:

这些app数据都是通过app得分得出的;

筛选出代表性app(能区分好人和坏人的app):规则主观定;

区分度:

骗贷效应是存在聚集效应的:

变量构建的技巧总结:
构建有区分度的指标作为变量筛选的标准;
文本分析利用TF-IDF作为标准选择;
选择有利特征,构建新的标准;
 
三. 数据描述:
单偏分布,右偏分布;
 
连续变量对分类变量的描述图,用箱线图描述比较好:
 
四. 模型结果:
好人app:

坏人app:

 

辅助放贷:

 

posted @ 2019-07-15 15:16  沐子馨  阅读(1085)  评论(0编辑  收藏  举报