摘要:
注:记录自己的第一次 Kaggle 文章目录 ResultCode数据预览数据导入数据查看 数据清洗删除多余特征缺失值填充 数据挖掘家庭总人数身份标识年龄分级票价分级 数据准备数据编码训练特征选择训练集测试集 模型训练预测 Result Code 数据预览 数据导入 # This Python 3 阅读全文
摘要:
文章目录 数据概览相关性矩阵获取数据可视化 数据概览 # 以波士顿房价数据为例 import pandas as pd train=pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/train.csv') t 阅读全文
摘要:
文章目录 距离度量曼哈顿距离欧氏距离 最近邻算法K-近邻算法算法实现决策规则KNN算法实现测试数据 丁香花分类加载数据集训练测试数据划分训练模型模型预测准确率计算K 值选择 距离度量 曼哈顿距离 曼哈顿距离又称马氏距离,是计算距离最简单的方式之一。公式如下: d m a n = ∑ i = 1 N 阅读全文
摘要:
文章目录 介绍Sigmoid分布函数逻辑回归模型对数损失函数梯度下降法逻辑回归实现加载数据函数代码汇总逻辑回归 逻辑回归 scikit-learn 实现 介绍 逻辑回归(Logistic Regression),又叫逻辑斯蒂回归,是机器学习中一种十分基础的分类方法,由于算法简单而高效,在实际场景中得 阅读全文
摘要:
对于一元线性函数: y ( x , w ) = w 0 + w 1 x y ( x , w ) = w _ { 0 } + w _ { 1 } x y(x,w)=w0+w1x 定义其平方损失函数为: f = ∑ i = 1 n ( y i − ( w 0 + w 1 x i ) ) 2 f = 阅读全文
摘要:
文章目录 一元线性回归模型加载数据集计算拟合参数拟合结果绘图 多元线性回归模型计算拟合参数 模型检验 一元线性回归模型 使用 SciPy 提供的普通最小二乘法分别计算 3 个特征与目标之间的一元线性回归模型拟合参数。 加载数据集 import pandas as pd data = pd.read_ 阅读全文
摘要:
文章目录 普通最小二乘法的缺陷岭回归推导岭回归拟合LASSO回归 普通最小二乘法的缺陷 普通最小二乘法带来的局限性,导致许多时候都不能直接使用其进行线性回归拟合。特别是以下两种情况: 数据集的列(特征)数量 > 数据量(行数量),即 X X X不是列满秩。数据集列(特征)数据之间存在较强的线性相关性 阅读全文
摘要:
文章目录 多项式回归介绍多项式回归基础实现二次多项式拟合实现N次多项式拟合使用 scikit-learn 进行多项式拟合 多项式回归预测导入数据集绘制图表查看变化趋势线性回归与 2 次多项式回归对比线性回归划分数据集训练模型并预测预测结果分析 2次多项式回归 更高次多项式回归预测多项式回归预测次数选 阅读全文
摘要:
文章目录 数据集读取与划分数据集读取数据集划分 模型训练及预测模型评价 数据集读取与划分 数据集读取 import pandas as pd ### 代码开始 ### (≈ 2 行代码) df=pd.read_csv("https://labfile.oss.aliyuncs.com/courses 阅读全文
摘要:
文章目录 前置知识一元线性回归Step1 导入数据Step2 一元函数代码实现Step3 平方损失函数代码实现Step4 最小二乘法代码实现Step4.1 代数方式实现Step4.2 矩阵方式实现 Step5 计算参数和平方损失值Step5.1 使用代数最小二乘函数实现Step5.2 使用矩阵最小二 阅读全文