金融数据分析

课程大纲:

第一课:数据分析基本知识复习(2课时) 

     1.  数据分析的基本概念

          a.  目的

          b.  数据获取和清理

          c.  数据的描述性统计与可视化

     2.  数据分析的常用模型

          a.  监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络

          b.  非监督式模型:聚类分析,因子分析,主成分分析

 

第二课:银行信贷客户的聚类分析-非监督式聚类(2课时)

 

     1.  数值型变量的归一化

     2.  类别型变量的编码

     3.  距离的概念和种类

     4.  闵可夫斯基距离

     5.  VDM(Value Difference Metric)距离

     6.  聚类的性能度量

          a.  Davies-Bouldin Index

          b.  Dunn Index

     7.  K-均值算法的难题:如何选取k

 

第三课:银行信贷客户的聚类分析-非监督式聚类(续)(2课时)

 

     1.  数据描述

     2.  数据预处理的实操:归一化与编码

     3.  K-均值算法用于信贷客户的聚类分析

     4.  层次聚类法用于信贷客户的聚类分析

 

第四课:银行信贷客户的聚类分析-半监督式聚类(2课时)

 

     1.  半监督聚类

    a.  约束K-均值算法

     2.  带有少量标签的K-均值算法

 

第五课:行为评分卡模型的简介(2课时)

 

     1.  个人信贷产品的简介及其中的各类风险

     2.  什么是评分卡模型

     3.  信用风险领域的评分卡模型

           a.  申请评分卡

           b.  行为评分卡

           c.  催收评分卡

     4.  评分卡模型的时间窗口概念

           a.  表现期

           b.  观察期

5.  拓展:PD模型与巴塞尔协议

 

第六课:行为评分卡模型的特征构造(2课时)

 

     1.  训练集和测试集的划分

     2.  特征构造

    a.  逾期类型特征

           b.  还款率类型特征

    c.  使用率类型特征

    d.  消费类型特征

    e.  其他类型特征

     3.  变量的分箱和WOE计算

 

第七课:行为评分卡模型的特征挑选(2课时)

 

     1.  IV的概念

     2.  单变量分析

     3.  多变量分析

     4.  线性相关性

     5.  多重共线性

 

第八课:行为评分卡模型的逻辑回归模型(2课时)

 

     1.  逻辑回归模型的基本概念

           a.  什么是逻辑回归

           b.  逻辑回归中的参数估计

           c.  逻辑回归的正则化:LASSO(L1约束) & Ridge(L2约束)

     2.  用逻辑回归构造行为评分卡模型

     3.  从概率到分数

 

第九课:行为评分卡模型的验证、监控和调优(2课时)

 

     1.  评分卡模型常用的评价指标

           a.  KS

           b.  AR

           c.  PSI

           d.  Kendal’s Tau

     2.  Assigned PD & Actual PD

     3.  模型监控的概念

          a.  模型监控的频率

          b.  模型监控的解读

     4.  模型的调优

 

第十课:组合评分卡模型(2课时)

 

     1.  组合模型概述

     2.  串行结构的评分组合模型

     3.  异态并行结构的评分组合模型

     4.  同态并行结构的评分组合模型
————————————————

posted @ 2020-06-26 16:25  Slashout  阅读(686)  评论(0编辑  收藏  举报