摘要: 【项目目标】 这个数据集是台湾某银行 2005 年 4 月到 9 月的信用卡数据,数据集一共包括 25 个字段,现在我们的目标是要采用随机森林算法,针对这个数据集构建一个分析信用卡违约率的分类器。 【项目过程】 1.数据获取 2.数据探索、数据规范化、数据集划分 3.模型创建、模型训练、模型评估 【 阅读全文
posted @ 2020-11-26 02:55 止一 阅读(640) 评论(0) 推荐(0) 编辑
摘要: 统计学是通过什么检测两个变量之间是否有关系? 例如身高和性别是否有关系 答:通过检测男性样本的身高均值 VS 女性样本的身高均值 是否有差异, 有差异就说明两个变量之间存在关系。检验均值的差异是否为零,不看大小只看是否为零 参数估计 例题:北京市领导想知道当年住宅价格增长率是否达到了国家限定的阈值, 阅读全文
posted @ 2020-11-26 01:20 止一 阅读(1148) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import matplotlib.pyplot as plt 构造一元二次方程 x = np.linspace(-1, 6, 141) y = (x-2.5)**2-1 绘图 plt.plot(x,y) 目标函数 def J(theta): try: retu 阅读全文
posted @ 2020-11-26 01:02 止一 阅读(134) 评论(0) 推荐(0) 编辑