02 2021 档案
摘要:用线性回归模型进行预测常见问题: 1.实际数据可能不是线性的;如下图的模型: 安斯库姆四重奏里的四个不同的数据集,用线性回归模型拟合出来的直线相同,这些数据的均值方差都相同,为了看出拟合的效果,我们会利用R^2等指标进行模型诊断。 2.多重共线性(一些特征向量之间线性相关): 解决办法:正则化、主成
阅读全文
摘要:在先前的模型预测过程中,我们已经初步优化了模型的算法,使得预测效果更好了一些,接下来,我们可以通过特征工程构建,进一步优化模型的预测效果。 先对数据进行数据集转化,将一些特征标准化,方便后续操作,首先对时间特征进行统一,在我们的数据集中,时间特征有:date、hour、weekday、month、y
阅读全文
摘要:案例描述:市场上推出了某款共享单车,运营了一段时间,得到了一系列影响租车因素的数据和当天的租车数量,请你根据这些数据,进行回归分析,预测以后某天的共享单车时租适量,方便公司投放以获取最大收益。 案例数据集:Bike_Sharing_data 字段说明: datetime 详细到小时的日期+时间戳 s
阅读全文
摘要:缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。 缺失值的产生的原因多种多样,主要分为机械原因和人为原因。 机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器损坏,机械故障导致某段时间数据
阅读全文
摘要:前几天完成了机器学习的第一个基础实战案例,Boston房价预测,今天来分享一下我在学习过程中的心得体会! Boston房价预测是机器学习过程中一个关于线性回归的问题,属于监督学习。本文通过对Boston房价进行分析,进行机器学习模型训练。本文所使用的的数据集下载:Boston_housing_pre
阅读全文
摘要:目前为止,在机器学习的过程中,回归分析由如下几部分构成: 线性回归(LinearRegression):这一类问题就是我们高中所学习过的回归问题。我们常使用最小二乘法逼近进行拟合,有时候也使用最小化“拟合缺陷”(最小绝对误差回归)或者在桥回归中最小化最小二乘损失函数的惩罚;拟合方程:一般来说,线性回
阅读全文

浙公网安备 33010602011771号