基于外部数据的用户信用评估

社交和移动互联网快速的促进互联网金融的发展,支付宝,P2P,众筹等。金融中一个比较重要的问题则是信用评估,即对借债人进行信用评估,并以此来决定是否向用户贷款,贷款额,利率等。有的公司当做一个二分类来做,更多公司直接预测是贷款额度,本身也是一个多分类问题。

传统信用评估主要根据银行历史信息,信用卡记录,政府数据对用户进行评估。但通常只有一些高收入人群在银行数据库有着丰富的历史信息,而占很大比例的普通用户,比如刚毕业的大学生,则没有太多的交易记录和信用卡使用记录。针对这些普通用户,有公司就利用覆盖度更大的社交,购物网站等外部数据对用户快速的进行信用评估。wecash的目标人群定位于毕业四五年内的大学生。同时传统的信用评估都是通过人工对候选人进行评审,评审要求比较严格,虽然坏账率很低,但是其营业额同样也很低,因此一些公司就希望能够通过查看用户更多的数据来短时间内评估人的信用,在保证坏账率的水平下提高业务量。

现有的数据公司往往只能挖掘一类群体的信用程度,比如客户端是iphone 4s并且关注股票信息的人信用是怎样的。然而并不能精准到具体的人,可能也没有必要精准到具体人,具体到人后反而还可能会用到群体的数据来进行分析,毕竟单个人的数据有限。如果要想精确到人的话,有两个挑战,一个内部客户id和外部数据id的匹配,另一个是用户再不同外部平台上的id mapping。这两种mapping方法目前大都让用户参与某种活动或提供用户某种服务让用户提供自己不同网站上的账号,比如微信用户可以方便添加自己linked in,google+上的朋友,这样就可以把 webchat linked in google+连接起来了。学术中有所研究,但是很难用户实际项目中。现在用户数据在用户毫不知情,即使知情也没办法的情况下被各公司用于变现。与其白白的让自己的数据被别人使用,有公司就提出让用户来管理自己的数据,通过主动提供自己的数据来获取变现利润分成。这种做法也有风险,一个是法律问题,另一个是反作弊,用户套现。

最近做了用微博来做用户信用评估的项目。用户的社交数据是一种线上信息,而用户的信用标签则主要依据offline生活。是否能找到潜在特征来描述用户线上社交和信用之间的联系呢?尝试了很多特征与组合,效果维乎甚微,同时信用评估一个特殊性在于特征要具有可解释性,要很明确的知道这个特征是什么意思,特征的变化造成信用的变化趋势是否常理,要明确的知道最终的信用评分怎么得到的。微博不是一个强社交媒体,弱关系很少有用户分享自己的私人状态,有人认为强社交平台比弱社交平台更适合做信用评估。两者结合可能比较好,强关系(webchat)提供私人状态,弱关系(weibo)提供兴趣标签。

在做的过程,有以下几个思路

一. 基于特征,提取有关用户各方面的特征,训练预测模型

二. 基于亲密关系的黑名单扩展,传统的信用评估中,同事,家庭关系是信用评价的一个主要因素。这里挖掘用户的亲密关系/亲密度就成为了主要工作。平安最近出了一个credoo(credit with o2),里面一个重要的服务就是黑名单库。

三. 信用减法,在做基于特征的方法中,发现有些特征好坏人区分度很大,但是覆盖率比较低,在模型学习的过程中这些特征往往被忽略了。因此做减法就是一旦出现某中坏信用相关的特征,减去相应的分值,这里问题就转成了坏信用人群的共性pattern挖掘。

信用评估可以以一种服务的方式应用于某一业务,国外有公司可以提供你一个 credit card,然后用户可以拿着这个card很方便的做一些事情。

  1. 互联网金融:小额贷款,p2p借贷,众筹等
  2. 二手交易:可以对买卖双方进行信用评估供二手交易进行前参考
  3. Online Dating : 
  4. HR招聘:对候选人的信用做评估,国外的公司在你入职前都会对你以前的工作做检查。
  5. 办护照(芝麻征信),享受快捷服务(预约不需要再打电话)

posted on 2015-06-09 14:06  keketse  阅读(565)  评论(0编辑  收藏  举报

导航