摘要: 1. logistic sigmoid 函数 logistic sigmoid 函数通常用来产生 Bernoulli 分布中的参数 ϕ,因为它的范围是(0,1),处在 ϕ 的有效取值范围内 sigmoid 函数在变量取绝对值非常大的正值或负值时会出现饱和(saturate)现象,意味着函数会变得很平 阅读全文
posted @ 2018-11-23 13:54 大来 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 1.Bernoulli 分布(Bernoulli distribution) 单个二值随机变量的分布 它由单个参数 ϕ ∈ [0,1] 控制,ϕ 给出了随机变量等于 1 的概率 2.Multinoulli 分布 具有k个不同状态的单个离散随机变量上的分布 经常用来表示对象分类的分布 3.高斯分布 也 阅读全文
posted @ 2018-11-23 11:09 大来 阅读(1155) 评论(0) 推荐(0) 编辑
摘要: 1.期望 当 x 由 P 产生,f 作用于 x 时,f(x) 的平均值 离散型随机变量,这可以通过求和得到: 连续型随机变量可以通过求积分得到: 性质: 其中 α 和 β 不依赖于 x 2.方差 衡量的是当我们对 x 依据它的概率分布进行采样时,随机变量 x 的函数值会呈现多大的差异 当方差很小时, 阅读全文
posted @ 2018-11-23 10:19 大来 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 1.条件概率 给定其他事件发生时出现的概率 公式 链式法则: 2.相互独立的(independent): 两个随机变量 x 和 y,如果它们的概率分布可以表示成两个因子的乘积形式,并且一个因子只包含 x 另一个因子只包含 y称这两个随机变量是相互独立的(independent) 关于 x 和 y 的 阅读全文
posted @ 2018-11-22 17:01 大来 阅读(3345) 评论(0) 推荐(0) 编辑
摘要: 1.随机变量(random variable) 可以随机地取不同值的变量。 通常用无格式字体 (plain typeface) 中的小写字母来表示随机变量本身,而用手写体中的小写字母来表示随机变量能够取到的值。 随机变量可以是离散的或者连续的。 2.概率分布 描述随机变量或一簇随机变量在每一个可能取 阅读全文
posted @ 2018-11-22 16:12 大来 阅读(769) 评论(0) 推荐(0) 编辑
摘要: 1.主成分分析(principal components analysis, PCA) 阅读全文
posted @ 2018-11-22 14:48 大来 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 1.行列式 行列式,记作 det(A),是一个将方阵 A 映射到实数的函数,行列式等于矩阵特征值的乘积 行列式的绝对值可以用来衡量矩阵参与矩阵乘法后空间扩大或者缩小了多少。 如果行列式是 0,那么空间至少沿着某一维完全收缩了,使其失去了所有的体积。 如果行列式是 1,那么这个转换保持空间体积不变 阅读全文
posted @ 2018-11-22 11:26 大来 阅读(916) 评论(0) 推荐(0) 编辑
摘要: 1.Moore-Penrose 伪逆(Moore-Penrose pseudoinverse) 矩阵 A 的伪逆定义为: A + = lima↘0 (A⊤ A + αI) −1 A ⊤ . 计算伪逆的实际算法没有基于这个定义,而是使用下面的公式: A + = VD + U ⊤ 其中,矩阵 U,D 和 阅读全文
posted @ 2018-11-22 11:20 大来 阅读(4216) 评论(0) 推荐(0) 编辑
摘要: 1.特征分解 将矩阵分解成一组特征向量和特征值 2.方阵 A 的特征向量(eigenvector) 与 A 相乘后相当于对该向量进行缩放的非零向量 v Av = λv 标量 λ 被称为这个特征向量对应的特征值(eigenvalue) 如果 v 是 A 的特征向量,那么任何缩放后的向量 sv (s ∈ 阅读全文
posted @ 2018-11-22 10:27 大来 阅读(1258) 评论(0) 推荐(0) 编辑
摘要: 1.对角矩阵(diagonal matrix) 只在主对角线上含有非零元素,其他位置都是零 对角方阵的逆矩阵存diag(v) −1 = diag([1/v 1 ,...,1/v n ] ⊤ ) 2.对称(symmetric)矩阵 转置和自己相等的矩阵 A = A ⊤ 3.单位向量(unit vect 阅读全文
posted @ 2018-11-21 15:39 大来 阅读(508) 评论(0) 推荐(0) 编辑