11-21

念念不忘 必有回响

2020年2月19日

汽车金融评分卡

摘要: 项目目的:利用车贷金融数据建立评分卡,并尝试多次迭代观察不同行为对模型,以及建模中间过程产生哪些影响。 首先是标准化导入需要使用的工具 import pandas as pd import numpy as np import matplotlib.pyplot as plt plt.style.u 阅读全文

posted @ 2020-02-19 23:12 11-21 阅读(891) 评论(0) 推荐(0) 编辑

2019年12月12日

Lending Club 数据做数据分析&评分卡

摘要: 一 :项目目的 研究Lending Club 贷款的风险特征,并提出建模方案。 二:数据获取 数据集来自Lending Club平台发生借贷的业务数据,2017年第一季度,具体数据集可以从Lending Club官网下载,需要先用邮箱注册一个账号。 三:数据探索 1.导入需要用到的工具 import 阅读全文

posted @ 2019-12-12 22:42 11-21 阅读(4193) 评论(0) 推荐(0) 编辑

2019年11月25日

时间序列分析和预测 (转载)

摘要: 一、时间序列及其分解时间序列(time series)是同一现象在不同时间上的相继观察值排列而成的序列。根据观察时间的不同,时间序列中的时间可以是可以是年份、季度、月份或其他任何时间形式。 时间序列: (1)平稳序列(stationary series)是基本上不存在趋势的序列,序列中的各观察值基本 阅读全文

posted @ 2019-11-25 01:07 11-21 阅读(4310) 评论(0) 推荐(0) 编辑

2019年11月24日

距离计算公式总结(转载)

摘要: 计算推荐对象的内容特征和用户模型中兴趣特征二者之间的相似性是推荐算法中一个关键部分 ,相似性的度量可以通过计算距离来实现 在做很多研究问题时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样 阅读全文

posted @ 2019-11-24 17:25 11-21 阅读(2590) 评论(0) 推荐(0) 编辑

机器学习常用算法与辅助函数公式

摘要: 1.去量纲 标准化:x=(x-min(x))/(max(x)-min(x)) 特点:容易受极端值影响,需要先去除极端值。 归一化:z-score=(x-均值)/标准差 特点:不受极端值影响,但是计算量较大 2.辅助函数 Sigmoid函数: 1 / (1+e-x)发生的概率 1 / (1-e-x)不 阅读全文

posted @ 2019-11-24 01:38 11-21 阅读(690) 评论(0) 推荐(0) 编辑

2019年11月23日

金融领域常用的数据分析方法

摘要: 1.策略的收紧与放松 策略放松:命中率方法 假设我们有200条策略,这些策略将我们的客户包围起来,某一客户击穿任意策略,既做拒绝处理。 注:数据经过处理,请勿对号入座 如果我现在需要放开策略,那么就选择有唯一命中率的策略分阶段分 批次的放开,观察效果,或者首先把客户分成A,B,C三类,A类最好,那么 阅读全文

posted @ 2019-11-23 22:34 11-21 阅读(1931) 评论(0) 推荐(0) 编辑

常用模型评估方法总结

摘要: 1.线性相关系数(皮尔逊相关系数)(用于描述两个变量之间相关性的强弱,系数越大相关性越强) rxy=∑(xi-x-)(yi-y-)÷√∑(xi-x-)2(yi-y-)2 一般判别效力为: 无相关←0.2←弱→0.4←中→0.6←强→0.8←极强→1 2.决定系数(用于描述非线性或两个以上自变量的相关 阅读全文

posted @ 2019-11-23 03:35 11-21 阅读(5683) 评论(0) 推荐(0) 编辑

2019年11月22日

A--集成算法的实现

摘要: 集成算法,一种简单好用的算法思路,保存在这里方便以后复习 阅读全文

posted @ 2019-11-22 15:27 11-21 阅读(430) 评论(0) 推荐(0) 编辑

A--随机森林(RF)的 sciklit-learn 实现

摘要: 一、决策树的决策边界 In [2]: import numpy as np import pandas as pd In [7]: #利用sklearn中提供的make_blobs函数生成一个服从高斯分布的二维数组,且将其随机分为四类 from sklearn.datasets import mak 阅读全文

posted @ 2019-11-22 14:14 11-21 阅读(515) 评论(0) 推荐(0) 编辑

A--Scikit-Learn 实现决策树

摘要: 决策树分类方法速度很快,⽽且不需要进行数据清洗,所以通常很适合作为初步分类手段,在借助更复杂的模型进行优化之前使用。 选择模型类 在Scikit-Learn中分类树算法都保存在tree模块中,具体算法所属类为DecisionTreeClassifier In [1]: from sklearn.tr 阅读全文

posted @ 2019-11-22 13:57 11-21 阅读(335) 评论(0) 推荐(0) 编辑

导航