信用卡评分模型(五)
摘要:最近在探索xgboost 调参事情,现在存在着几点问题: 1.调参方式,网上有多种调参方式,但是基本都是一个一个参数去调,贪心算法,只能满足局部最优,但是我们的参数都是相互影响的,局部最优,组合起来并非是最优的。 2.我基本都是确定几个参数的固定形式,比如说树的深度=3,最小叶节点=样本*5%,sc
阅读全文
posted @
2021-11-29 17:21
小小喽啰
阅读(724)
推荐(1) 编辑
kaggle 2015年航班延误
摘要:数据来源:https://www.kaggle.com/usdot/flight-delays 该数据集完整数据量有500多万条航班记录数据,特征有31个 感觉这个数据不是很好,如果我们将ARRIVAL_DELAY作为y值,但是后面的空气系统延误,安全延误感觉又像是延误的原因,我们首先看一下数据怎么
阅读全文
posted @
2021-04-06 15:50
小小喽啰
阅读(1448)
推荐(0) 编辑
信用卡欺诈检测Credit Card Fraud Detection(kaggle)
摘要:地址:https://www.kaggle.com/mlg-ulb/creditcardfraud 数据概述 数据集包含2013年9月欧洲持卡人通过信用卡进行的交易。该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172
阅读全文
posted @
2021-02-09 11:33
小小喽啰
阅读(2553)
推荐(0) 编辑
信用卡评分模型(四)
摘要:数据来源:https://www.kaggle.com/c/GiveMeSomeCredit https://www.statsmodels.org/stable/generated/statsmodels.discrete.discrete_model.Logit.html#statsmodels
阅读全文
posted @
2021-01-20 21:04
小小喽啰
阅读(773)
推荐(0) 编辑
预测信用卡流失客户
摘要:kaggle数据地址:https://www.kaggle.com/sakshigoyal7/credit-card-customers 导入数据 #导入模块 import pandas as pd import numpy as np import matplotlib.pyplot as plt
阅读全文
posted @
2020-12-11 15:18
小小喽啰
阅读(1644)
推荐(0) 编辑
信用卡模型(三)
摘要:第三版本 我们前面已经有两个版本了,都涉及到woe转换之类的,现在我们尝试一下xgboost版本的,不需要做woe转换 import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e
阅读全文
posted @
2020-09-21 18:27
小小喽啰
阅读(669)
推荐(0) 编辑
信用卡评分模型(二)python
摘要:前面已经有了一篇信用卡的文章,拓展不同方法 前面的处理方式都一样,主要不同的是从缺失值开始的: #导入模块 import pandas as pd import numpy as np from scipy import stats import seaborn as sns import matp
阅读全文
posted @
2020-08-14 10:13
小小喽啰
阅读(1697)
推荐(0) 编辑
转:信用评分卡模型分析(基于Python)--理论部分
摘要:信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。 我们主要讨论主体评级模型的开发过程。 在互金公司等各
阅读全文
posted @
2020-08-13 11:32
小小喽啰
阅读(1308)
推荐(0) 编辑
信用评分卡(一)
摘要:目录 导入数据 缺失值和异常值处理 特征可视化 特征选择 模型训练 模型评估 模型结果转评分 计算用户总分 一、导入数据 #导入模块 import pandas as pd import numpy as np from scipy import stats import seaborn as sn
阅读全文
posted @
2020-08-12 17:34
小小喽啰
阅读(1023)
推荐(0) 编辑