python 金融大数据风控建模实战--基于机器学习

王青天 孔越编著, 2020年6月第一版

 

第一章介绍,介绍金融科技fintech是指使用技术提供财务解决方案。人工智能和机器学习技术可以帮助包括欺诈预防、风险管理、客户服务和营销等多个环节的智能化。个人借贷交易的不同阶段涉及线上借贷行业的9种风险:信用检查不足、中介不充分、还款不及时、流动性不足、缺乏透明度、运营和技术失败、法律风险、过度杠杆和道德缺失,其中信用检查不足风险是最需要控制的风险。

个人信贷中信用风险评估的关键是,通过分析借贷人的信用信息,评估借款人的偿还能力和意愿量化违约风险。信用评分卡模型是个人信贷风险管理中的重要手段。评分卡模型过包括申请评分卡、行为评分卡、催收评分卡,除此之外还有反欺诈模型(无征信前、申请数据、第三方数据)、营销评分卡和客户流失卡等。欺诈行为氛围个人欺诈和团伙欺诈,个人欺诈往往形式各异难以形成普适的规则,只能通过不断积累和总结规则库来进行甄别;对于团伙欺诈啊,需要借助知识图谱技术发现欺诈团伙潜在的关系网,找到异常状态进行甄别。因此,反欺诈模型一般采用基于规则与策略的方法。

接下来讲了评分卡模型的开发流程。

 第二章,机器学习介绍

机器学习分为有监督学习、无监督学习和强化学习。

有监督学习分为分类问题(离散)和回归(连续)问题。常见算法有线性回归模型、神经网络模型、支持向量机模型、决策树模型、随机森林、Xgboost模型和深度学习模型等。评分卡模型的开发就是有监督学习,而且是分类问题。

无监督学习的任务一般为聚类分析、降维、关联规则分析。常见聚类:Kmeans、混合高斯模型、DBCAN和AP算法等。线性降维方法:PCA,SVD分解;非线性:KPCA。关联规则分析:Apriori和FP-growth,可以通过关联分析挖掘欺诈数据的特征集,形成反欺诈规则。

强化学习又称增强学习(Reinforcement Learning),是一种特定场景下通过不断试错的方式进行自我更新并学习的方法。

 

posted on 2021-06-28 20:22  椰汁黑糯米  阅读(1032)  评论(0编辑  收藏  举报

导航