概率论
文本记录深度学习常用的概率论知识。
基础概念
- 随机变量:概率论通过随机试验来研究随机现象中的统计规律性。可是随机试验需要大量重复,为了更好地去表示整个统计规律性,研究时借助了随机变量这一概念,于是有关随机事件的计算就变成随机变量的计算。随机变量分连续型随机变量(continuous variables)和离散型随机变量(discrete variables)。
- 概率分布函数:函数\(F(x) = P(X \leq x)\)称为随机变量\(X\)的概率分布函数。
- 连续型随机变量的概率密度函数f(t):\(F(x) = \int_{-\infty}^{x}f(t)dt\)
- 边缘概率
- 条件概率:\(P(AB) = P(A)P(B|A) = P(B)P(A|B)\),其中\(P(A), P(B) > 0\)
期望、方差、协方差、协方差矩阵
1. 期望
- 离散型随机变量的期望:\(E(X) = \sum_{k=1}^{\infty}x_k p_k\)
- 连续型随机变量的期望:\(E(X) = \sum_{-\infty}^{\infty}xf(x)dx\)。
性质:
- \(E(X) + E(Y) = E(X+Y)\)
- 如果\(X\)和\(Y\)独立,\(E(X)E(Y)=E(XY)\)
2. 方差
刻画了随机变量取值的波动大小:方差越小,越靠近均值;方差越大越远离均值。
\[Var(f(x)) = \Bbb{E}[(f(x) - \Bbb{E}[f(x)])^2]
\]
3. 协方差
刻画了两个随机变量的线性相关性,绝对值大小刻画了相关性大小,0表示不相关;正负表示了正相关和负相关;
\[Cov(f(x), g(y)) = \Bbb{E}[(f(x) - \Bbb{E}[f(x)])(g(y) - \Bbb{E}[g(y)])]
\]
协方差矩阵
常见概率分布
- 伯努利分布
- 多重伯努利分布
- 高斯分布(正态分布)
- 指数分布和拉普拉斯分布
- 狄拉克分布(Dirac Distribution)和经验分布(Empirical Distribution)
- 混合分布和高斯混合模型
常见函数的有用属性
- logistic sigmoid
- softplus function
- 贝叶斯定理
连续随机变量的技术细节
略
- quantum [ˈkwɑːntəm] 量子
- scenario [səˈnærioʊ] 设想,可能发生的情况;剧情梗概
- brittle [ˈbrɪtl] 易碎的;脆弱的
- prone [proʊn] likely to suffer from sth or to do sth bad