山东-日照分赛场-公积金贷款逾期预测
摘要:数据链接:http://data.sd.gov.cn/cmpt/cmptDetail.html?id=26 评分标准:给定一个阀值,可根据混淆矩阵计算TPR(覆盖率)和FPR(打扰率) TPR = TP /(TP + FN) FPR = FP /(FP + TN) 其中,TP、FN、FP、TN分别为
阅读全文
posted @
2021-01-27 15:12
小小喽啰
阅读(619)
推荐(0) 编辑
征信上的担保类型
摘要:抵押:将物品所有权/收益权/归属权等权益给银行,在不影响物品使用权的情况下,为对应授信提供保证; 组合(不含保证):一般指的是,银行给A授信,B同时担保。A还不了的话,需要裁定A确实还不了了,人不见了或者真没钱了,此时B还钱 组合(含保证):一般指的是,银行给A授信,B同时担保,银行可以直接问AB要
阅读全文
posted @
2021-01-25 15:50
小小喽啰
阅读(1350)
推荐(0) 编辑
信用卡授信额度为0的情况
摘要:信用卡额度为0是什么情况? 一、综合评分不高 当银行在对申请人进行审核的时候,如果申请人达到了申请的条件,但是综合评分并不是特别高,却又有发展潜力的话,银行还是会为申请人批卡的,只是银行为了减小自身风险,给申请人批的卡额度就会为0。 二、准贷记卡 人们在去申请信用卡时,有时银行会为申请人批一张准贷记
阅读全文
posted @
2021-01-22 10:10
小小喽啰
阅读(1032)
推荐(0) 编辑
信用卡评分模型(四)
摘要:数据来源:https://www.kaggle.com/c/GiveMeSomeCredit https://www.statsmodels.org/stable/generated/statsmodels.discrete.discrete_model.Logit.html#statsmodels
阅读全文
posted @
2021-01-20 21:04
小小喽啰
阅读(773)
推荐(0) 编辑
pandas 找出某列最大值的所在的行
摘要:比如说,要根据某一列的最大值找出每个人所在的行,或者说找出每个人数学成绩最高的那一年 gjj_data_meger.groupby('reportno').apply(lambda t: t[t.gettime==t.gettime.max()]) 但是要注意的是,这一些的值需要是能用max()计算
阅读全文
posted @
2021-01-19 17:01
小小喽啰
阅读(5285)
推荐(0) 编辑
阿里云金融风控-贷款违约预测建模
摘要:直接附上代码 # -*- coding: utf-8 -*- """ Created on Sat Jan 16 15:18:33 2021 @author: Administrator """ import pandas as pd import numpy as np import matplo
阅读全文
posted @
2021-01-16 19:27
小小喽啰
阅读(616)
推荐(0) 编辑
归一化、标准化 & 正则化
摘要:我们经常将归一化和标准化弄混淆,下面简单描述一下他们之间的差异 归一化(Normalization) 归一化的目标是找到某种映射关系,将原数据映射到[a,b]区间上。一般a,b会取[−1,1],[0,1]这些组合 一般有两种应用场景: 把数变为(0, 1)之间的小数 把有量纲的数转化为无量纲的数 常
阅读全文
posted @
2021-01-13 11:45
小小喽啰
阅读(1781)
推荐(0) 编辑
pandas 查看某列的值有重复值,并将这些重复值找出来
摘要:我们先知道某一列是否有重复值,并将这些重复值找出来 a = zongti.groupby('reportno').count()>1 a[a['ref_id'] == True].index #里面的列,随便一列都行 结果: Index(['2016122100003477314271', '201
阅读全文
posted @
2021-01-12 17:39
小小喽啰
阅读(6929)
推荐(0) 编辑
plt.savefig 保存图片
摘要:画图占的内存很多,经常导致jupyter 卡顿,当图片超级多时,将图片复制到Excel里面也会导致Excel崩溃,因此需要我们将图片单独保存起来 import seaborn as sns import matplotlib.pyplot as plt fig = plt.figure(figsiz
阅读全文
posted @
2021-01-07 09:38
小小喽啰
阅读(45706)
推荐(2) 编辑
添加代码运行时间
摘要:如果我们直接执行一个py文件,想知道这个文件需要运行多久,又或者是自己编写的函数,看看需要耗时多久,就可以使用如下: #将下面这两段放在首位,中间是代码块 import datetime start=datetime.datetime.now() #中间写代码块 end=datetime.datet
阅读全文
posted @
2021-01-05 11:20
小小喽啰
阅读(170)
推荐(0) 编辑
python category 和object 数据类型区别
摘要:一、category数据类型 Categoricals 是 pandas 的一种数据类型,对应着被统计的变量。 Categoricals 是由固定的且有限数量的变量组成的。比如:性别、社会阶层、血型、国籍、观察时段、赞美程度等等。 与其它被统计的变量相比,categorical 类型的数据可以具有特
阅读全文
posted @
2021-01-04 10:07
小小喽啰
阅读(2862)
推荐(0) 编辑