机器学习十讲（二）

数学知识回顾：

矩阵的逆

对于n*n方阵A，如果存在矩阵B使得AB = BA = I,则称B为A的逆矩阵，记为A^-1
若A为可逆矩阵，则其逆矩阵是唯一的
如何判断矩阵是否可逆？
- 行列式不等于0
- 满秩
- 行（或列）向量组线性无关
- ...

import numpy as np

# 格式化numpy输出
np.set_printoptions(formatter={'float': '{:0.2f}'.format})
A = np.array([[4, 5, 1], [0, 8, 3], [9, 4, 7]])
# 求行列式
print("行列式" + str(np.linalg.det(A)))
B = np.linalg.inv(A)  # 求逆
print("A的逆矩阵为B：")
print(B)
print("BA:")  # 结果验证
print(B.dot(A))
print("AB:")
print(A.dot(B))

　　

回归：

回归如今指的用一个或多个自变量来预测因变量的数学方法
在机器学习中，回归指的是一类预测变量为连续值的有监督学习方法

在回归模型中，需要预测的变量叫做因变量，用来解释因变量变化的变量叫做自变量

一元线性回归：

模型为y = w₁x + w₀,其中w₀，w₁为回归系数
给定训练集D = {（x₁，y₁），...（x_n，y_n）}，我们的目标是找到一条直线y = w₁x + w₀使得所有样本尽可能落在它的附近。

多元线性回归：

y = w₁x₁ + w₂x ₂+...+ w_dx_d +w₀
训练集D = {（x₁，y₁），...（x_n，y_n）}
...
假设训练集的特征部分记为n*（d+1）矩阵X，其中最后一列取值全为1
标签部分记为...
最小二乘的参数估计，如果变量之间存在较强的共线性，则X^TX近似奇异，对参数的估计变得不准确，造成过度拟合现象。
解决方法：正则化，主成分回归、偏最小二乘回归

正则化可以减小线性回归的过度拟合和多重共线性等问题

岭回归：

岭回归：线性回归目标函数加上对W的惩罚函数
线性回归目标函数：
岭回归目标函数：
对w求导并令导数等于零易得：
根据岭迹做超参数

LASSO：

LASSO是一种系数压缩估计法，它的基本思想是通过追求稀疏性自动选择重要的变量
LASSO的目标函数：
LASSO的解

回归模型的评价指标

均方误差：
均方根误差：
平均绝对误差：
决定系数：

posted @ 2021-01-27 08:00 小赵不吃溜溜梅阅读(95) 评论(0) 收藏举报

刷新页面返回顶部