[学习记录]sklearn线性回归
本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作
首先导入库
import numpy as np import pandas as pd import scipy.stas as stats import sklearn
其次导入数据,这里使用的是sklearn中内置的数据集
from sklearn.datasets import load_boston boston=load_boston()
使用pandas整理数据
pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关性低于0.5则应该考虑换一个参考模型。
进行线性回归训练
对照测试集进行检验,检验的时候有三个重要指标,三个指标均越小越好
MAE:mean absolute error,预测时发生的平均偏差,取绝对值
MSE:mean squared error,对预测时产生的偏差进行平方处理,导致错误重度惩罚,正确轻度奖励
RMSE:root mean squared error,相当于对MSE结果开平方根
之前介绍的模型是一个自变量一个因变量,也支持多个自变量,就结果来看该模型不如上一个准确