摘要:
建议和 Conda 命令一起看,pip 和conda命令有点相似。《Conda 命令》 1 查看帮助文档 pip --help 使用该命令将告诉你 pip 的常用命令。 使用时,输入pip <command> [options] 形式的指令,即可执行相应的命令,并且,command 和 option 阅读全文
摘要:
t-SNE 算法 1 前言 t-SNE 即 t-distributed stochastic neighbor embedding 是一种用于降维的机器学习算法,在 2008 年由 Laurens van der Maaten 和 Geoffrey Hinton 提出。 t-SNE 是一种非线性降维 阅读全文
摘要:
伯努利试验 伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生。 我们假设该项试验独立重复地进行了 $n$ 次,那么就称这一系列重复独立的随机试验为 $n$ 重伯努利试验,或称为伯努利概型。单 阅读全文
摘要:
机器学习第一次作业 1.试设计一个不同于高斯核和Epanechnikov核的核函数。 2.如果 $\mathrm{N}$ 个独立的观测样本 $x_{1}, x_{2}, x_{3}, \ldots, x_{N}$ 服从概率密度 $\mathrm{p}(\mathrm{x} \mid \hat{\th 阅读全文
摘要:
可逆矩阵 矩阵 $A$ 为 $n$ 阶方阵,若存在 $n$ 阶矩阵 $B$,使得矩阵 $A、B$ 的乘积为单位阵,则称 $A$ 为可逆阵,$B$ 为 $A$ 的逆矩阵。若方阵的逆阵存在,则称为可逆矩阵或非奇异矩阵,且其逆矩阵唯一。 定义 设 $P$ 是数域, $A \in P^{n \times n 阅读全文
摘要:
梯度消失、爆炸带来的影响 举个例子,对于一个含有三层隐藏层的简单神经网络来说,当梯度消失发生时,接近于输出层的隐藏层由于其梯度相对正常,所以权值更新时也就相对正常,但是当越靠近输入层时,由于梯度消失现象,会导致靠近输入层的隐藏层权值更新缓慢或者更新停滞。这就导致在训练时,只等价于后面几层的浅层网络的 阅读全文
摘要:
转置是一个数学名词。直观来看,将A的所有元素绕着一条从第1行第1列元素出发的右下方45度的射线作镜面反转,即得到A的转置。一个矩阵M, 把它的第一行变成第一列,第二行变成第二列,......,最末一行变为最末一列, 从而得到一个新的矩阵N。 这一过程称为矩阵的转置。即矩阵A的行和列对应互换。 基本性 阅读全文
摘要:
实对称矩阵:如果有 $n$ 阶矩阵 $A$ , 其矩阵的元素都为实数, 且矩阵 $A$ 的转置等于其本身, 即 $A=A^{T}$ 则称 A 为实对称矩阵。 它有一些性质: 实对称矩阵属于不同特征值的特征向量相互正交(必线性无关)。 实对称矩阵属于 $ n_{i}$ 重特征值的线性无关的特征向量恰有 阅读全文
摘要:
奇异值分解 特征值分解是一个提取矩阵特征很不错的方法,但是它只是对方阵而言的,在现实的世界中,我们看到的大部分矩阵都不是方阵。 奇异值分解基本定理:若 $ A$ 为 $ m \times n$ 实矩阵, 则 $ A$ 的奇异值分解存在 $A=U \Sigma V^{T}$ $A=U \Sigma V 阅读全文
摘要:
特征值分解 设 $A_{n \times n}$ 有 $n$ 个线性无关的特征向量 $\boldsymbol{x}_{1}, \ldots, \boldsymbol{x}_{n}$,对应特征值分别为 $\lambda_{1}, \ldots, \lambda_{n} $ $A\left[\begin 阅读全文