16-银行常见6种反欺诈手段
16.银行6种常见的反欺诈手段
信贷业务是商业银行的主要利润来源,对整个银行的经营举足轻重。信贷业务下沉的同时,其风险也在不断扩张,基于新技术和新场景的欺诈形式和手段不断衍生,欺诈方式更具场景化、专业化、智能化。
16.1申请人真实性验证
常用的特征模块有面部识别、身份证二要素、银行卡三要素等。这一步基本上是一切互联网信贷行为的基础,只有确认了“你”是“你”,才会开展后续的业务。
16.2黑白名单
黑白名单是最原始的反欺诈手段,顾名思义,黑名单就是坏客户,白名单则指好客户。
举例:人行征信记录着每个信用卡持卡人的还款记录,如果你有信用卡逾期且拒绝还款,甚至直接从人间蒸发,你可能就上了人行的黑名单。一段时间后,你重新在江湖上复出,想着:申请新信用卡吧!银行在接到你的申请表后,在黑名单上一查,发现了你,于是乎,驳回!这就是黑名单的使用方式。
16.3规则引擎
黑名单的优缺点十分明显,优点就是简单方便,各行各业各产品的反欺诈都可以用黑名单,缺点是无法应对新出现的欺诈。黑名单的升级版本是规则引擎。
例如:你经常在淘宝上购买退货险,又屡屡退货,那么,你就有可能上了骗保的黑名单,想再次购买退货险就很难了。
举例:保险公司通过清单数据比对哪些人符合购买退货险的资质,经过一段时间的积累,保险公司发现,退货比例超过80%的用户极可能再次退货,疑似骗保;或者连续退货超过5次的用户的骗保嫌疑也非常大。于是乎,保险公司设定了一个阈值,规则如下:
(1)连续退货5次的用户,拒绝其购买退货险;
(2)退货比例超过80%,拒绝其再次购买退货险;
只要符合这两种规则的任何一个,其购买保险的交易就会被保险公司拒绝。这相比于黑名单,可以检测到部分新型欺诈者,增加了覆盖率。
但规则引擎却无法主动检测到新型欺诈模式。许多狡诈的欺诈分子会通过不断的测试规则,发现了规则的阈值。会将自己的退货率控制在79%以下, 继续骗取保费。一段时间后,保险公司再次发现了该模式,于是把阈值下调到50%。规则引擎通常可配合黑名单一起使用,通过规则引擎抓到的欺诈分子列到黑名单中。
但是规则引擎最大的问题在于只能依靠人为经验。这是一个十分耗费人力物力的过程,甚至还会出现经验错误而导致误判的状况。正因为经验的不确定性,规则通常需要投入大量的精力维护,不断更新、修改、删除添加等等,否则就会造成大量的假报和误报。
16.4有监督学习
有监督学习需要大量的有标签数据来训练模型,以此来预测还未被标注的数据。拿垃圾邮件举例,假设你把5000封已经由人工确认过的垃圾邮件输入到了模型,模型通过对标题的识别,对邮件内容句子的分割,关键词的识别等各种分析方法,找到了其中的内在关系,但却难以说明。
举例:
(1)标题里有“福利”二字的,有90%的可能性是垃圾邮件;
(2)内容里有“汇款账号:xxxxxx”的,有10%的可能性是垃圾邮件;
(3)一次性发送超过200封的,有60%的可能性是垃圾邮件;
(4)回复率低于10%的账户,有70%的可能性是垃圾邮件;
这里,百分比被称为权重。
当模型处理一封新的邮件,模型通过检测以上各个子项,并对每一个子项乘以权重后相加,就得出一个分数,得出:这封有80%的可能性是垃圾邮件。以上就是一个有监督学习抽象理解的过程,其中一个重要的步骤就是通过不断的迭代计算每一个子项应该被赋予的权重值。当权重值计算好后,就可以说这个模型训练好了。
有监督学习的好处也十分明显,它可以帮我们分析隐层关系。无需知道有监督学习的隐藏关系,每一个子项被赋予了多少权重,直接就知道符合某个规则的是坏客户。此外,有监督还有助于处理多维数据。由于规则是人凭经验产生了,当面对巨量的数据字段时,人显然是无法通过经验来直接操作的。此时,有监督就可以解决问题了。
但有监督也有一个明显的弊端,每一个模型都需要大量的训练数据,训练一个模型也需要较长的时间。常常出现你的模型还没有训练好,欺诈分子们就可能已经完成欺诈活动寻找下一个目标了。如此,有监督便无法应对复杂多变,诡计多端的欺诈者了。
16.5无监督学习
无监督学习反欺诈的主要方式有聚类和图形分析。无监督无需任何训练数据和标签,通过发现用户的共性行为,以及用户和用户的关系来检测欺诈。
有这样一群用户注册事件,通过聚类发现其几个小群符合某些共性:
例如:注册时间集中,都使用了某操作系统,某一个浏览器版本等。这个用户任何一个单独拿出来分析,看上去都是极其正常的用户,而如果其符合某种超乎寻常的一致性就十分可疑了。例如,一群人在凌晨2点-3点,采用chrome浏览器注册了某产品,其ip的前20位相同,GPS定位小于1公里,且注册后都去修改了昵称和性别。如果一个人这么做,问题不大。而如果一群人这么做显然就是不正常的。
无监督算法应用于反欺诈检测,通常还有一个优势,那就是提前预警。现在的欺诈分子都有潜伏期,以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律,具有某些一致性,所以还是会被无监督算法捕捉到。
16.6网络图谱
一种思路是通过识别紧密关联的社群结构找出潜在的欺诈客群,常用的社会感知分析方法有Walktrap算法、InfoMap算法、FastGreedy算法等。
一般来说,识别欺诈团伙需要用到设备指纹,比如:设备关联多少个手机号,设备关联多少个身份证,手机关联多少个设备,IP是否是异常IP,登陆IP数等;
另一种思路是通过好坏用户的网络关系进行传播,可以使用标签传播算法(Label Propagation),传染病学模型(SIR Model), 以及概率图模型(MRF, CRF等)。比如团伙中有多少个逾期,一度联系人里面有多少个预期,二度联系人有多少预期,一度联系人里面黑名单数量,二度联系人黑名单数,团伙中是否命中黑中介。