机器学习十讲——第二讲
一、前言
今天主要是讲解了有监督学习中回归的一系列问题,从简单的线性回归到岭回归、LASSO回归等。
回归问题简单来说就是根据所选定的特征值,通过选定的参数也就是权重,计算出预测的目标值,而学习的过程就是得出最符合的权重,使得预测值能够接近真实的目标值。
二、笔记
NumPy 矩阵求逆函数
numpy.linalg 模块包含线性代数的函数,可计算逆矩阵、求特征值、解线性方程组以及求解行列式等。
行列式:np.linalg.det(A) (判断是否存在逆矩阵)
计算逆矩阵:np.linalg.inv(A)
回归如今指的用一个或多个自变量来预测因变量的数学方法。
在机器学习中,回归指的是一类预测变量为连续值的有监督学习学习方法
在回归模型中,需要预测的变量叫做因变量,用来解释因变量变化的变量叫做自变量。
一元线性回归
多元线性回归(寻找一个超平面,使得训练集中样本到超平面的误差平方和最小)
多元线性回归的矩阵表示
假设训练集的特征部分即为n*(d+1)矩阵X,其中最后一列取值权威1
标签部分即为y=y(y1,y2,...yn)T,参数即为w=(w1,w2,...wd,w0)T
多项式回归:使用原始特征的二次项、三次项
线性回归解决非线性问题
问题:维度灾难、过度拟合
岭回归
思路:线性回归目标函数加上对w的惩罚函数