摘要: 信贷业务收益损失测算实操 信贷中常提的指标,久期,即生息月数 1、久期计算方法:按照不同贷款期限,分别获取不同放款月在相应账期的剩余本金。 单月久期=还款期限为3期的,计算mob0-mob2的剩余本金之和/放款金额。周转率=12/久期。 还款期限为3期账户的久期=所有达到3期账户,按照放款金额占比加 阅读全文
posted @ 2022-03-17 14:54 shirly_zhang 阅读(4037) 评论(0) 推荐(0) 编辑
摘要: 1. enumerate enumerate用于在循环过程中获得元素对应的索引,可分别得到索引和元素值。 marks = [5,4,0,33,45,67] for index,mark in enumerate(marks,start=1): print(index,mark) 2. zip zip 阅读全文
posted @ 2022-02-10 15:14 shirly_zhang 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 从线性回归(Linear regression)开始学习回归分析,线性回归是最早的也是最基本的模型——把数据拟合成一条直线。数据集使用scikit-learn里的数据集boston,boston数据集很适合用来演示线性回归。boston数据集包含了波士顿地区的房屋价格中位数。还有一些可能会影响房价的 阅读全文
posted @ 2022-02-10 14:48 shirly_zhang 阅读(1193) 评论(0) 推荐(0) 编辑
摘要: 一、模型开发 sklearn为所有模型提供了非常相似的接口,这样使得我们可以更加快速的熟悉所有模型的用法。在这之前我们先来看看模型的常用属性和功能 # 拟合模型 model.fit(X_train, y_train) # 模型预测 model.predict(X_test) # 获得这个模型的参数 阅读全文
posted @ 2022-02-09 15:25 shirly_zhang 阅读(879) 评论(0) 推荐(0) 编辑
摘要: 数据预处理 1、明确有多少特征,哪些是连续的,哪些是类别的。2、检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。3、对连续的数值型特征进行标准化,使得均值为0,方差为1。4、对类别型的特征进行one-hot编码。5、将需要转换成类别型数据的连续型数据进行二值化。6、为防止过拟合或者其 阅读全文
posted @ 2022-02-09 14:20 shirly_zhang 阅读(358) 评论(0) 推荐(0) 编辑
摘要: sklearn中的datasets数据集 ​ sklearn的数据集库datasets提供很多不同的数据集,主要包含以下几大类: 玩具数据集 真实世界中的数据集 样本生成器 样本图片 svmlight或libsvm格式的数据 从http://openml.org下载的数据 从外部加载的数据用的比较多 阅读全文
posted @ 2022-02-08 15:42 shirly_zhang 阅读(1770) 评论(0) 推荐(0) 编辑
摘要: 在一些数据分析业务中,数据缺失是我们经常遇见的问题,缺失值会导致数据质量的下降,从而影响模型预测的准确性,这对于机器学习和数据挖掘影响尤为严重。因此妥善的处理缺失值能够使模型预测更为准确和有效。 缺失值处理 构建数据集 import pandas as pd import numpy as np d 阅读全文
posted @ 2022-02-08 11:30 shirly_zhang 阅读(386) 评论(0) 推荐(0) 编辑
摘要: Matplotlib 中的 pyplot 模块是一个类似命令风格的函数集合,这使得 Matplotlib 的工作模式和 MATLAB 相似。pyplot 模块提供了可以用来绘图的各种函数,比如创建一个画布,在画布中创建一个绘图区域,或是在绘图区域添加一些线、标签等。以下表格对这些函数做了简单地介绍。 阅读全文
posted @ 2022-01-29 16:26 shirly_zhang 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 随机抽样,是统计学中常用的一种方法,它可以帮助我们从大量的数据中快速地构建出一组数据分析模型。在 Pandas 中,如果想要对数据集进行随机抽样,需要使用 sample() 函数。sample() 函数的语法格式如下: DataFrame.sample(n=None, frac=None, repl 阅读全文
posted @ 2022-01-29 14:28 shirly_zhang 阅读(1155) 评论(0) 推荐(0) 编辑
摘要: Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图操作。本节我们深入讲解一下 Pandas 的绘图操作。Pandas 之所以能够实现了数据可视化,主要利用了 Matpl 阅读全文
posted @ 2022-01-29 14:22 shirly_zhang 阅读(65) 评论(0) 推荐(0) 编辑