凯鲁嘎吉
用书写铭记日常,最迷人的不在远方

多元/多维高斯/正态分布概率密度函数推导 (Derivation of the Multivariate/Multidimensional Normal/Gaussian Density)

作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/

    当年在学《概率论与数理统计》时,遇到二元正态分布的概率密度函数,那个公式特别长,当时只是要求记住,并未深究其原因,今天终于有机会好好回顾一下了。二元/二维只是多元的一个特例,现在将问题延伸到多元/多维高斯/正态分布概率密度函数的推导上。多元高斯分布在很多场景下都有用,比如高斯混合模型(Gaussian Mixture Model)中,每个组件都是单个多元高斯分布,样本不仅是一维的,现实中大多是数据样本都是多维的。只有真正弄清楚公式的来龙去脉,来能更好的编写程序,进行实现(虽然很多包都是现成的,不需要自己从头编写)。想要推导概率密度函数公式,需要知道线性代数中矩阵论的一些基础知识,从单变量到二元/二维再延伸到多元/多维,本身就涉及到从标量到向量再到矩阵的一个过程。这篇博客详细推导了多元/多维高斯/正态分布概率密度函数公式,并应用到二维高斯分布中,进行进一步分析。也给出了当维度之间独立同分布(Independent identically distributed, i.i.d.)情况下多维高斯分布的概率密度函数的特例。值得注意的是,整个过程仅是对一个样本进行计算,该样本无论是一个标量,还是一个多维向量,最终出来的概率密度函数都是一个数(标量)。如果有N个样本(按列排开)的话,其概率密度函数就是N维列向量。注意:多元就是多维,高斯分布就是正态分布。(只是大概推导,过程可能并不严谨,望海涵)

1. 前提基础

    包括连续随机变量变换法(Transformations of Continuous Random Variables),单变量正态分布的概率密度函数(Univariate Normal Density),以及随机变量间的独立性(Independence of Random Variables)。

2. 多维高斯分布的概率密度函数定义及其推导

3. 多维高斯分布的概率密度函数(维度之间独立同分布)

4. 二维高斯分布的概率密度函数定义及其推导

5. 参考文献

[1] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计教程. 高等教育出版社, 2011.

[2] The Multivariate Normal Distribution http://www.randomservices.org/random/special/MultiNormal.html

[3] Basic Multivariate Normal Theory http://www2.stat.duke.edu/~st118/sta732/mvnormal.pdf

[4] 凯鲁嘎吉 - 博客园 - 左边栏搜索"高斯"相关博文 https://zzk.cnblogs.com/my/s/blogpost-p?Keywords=%E9%AB%98%E6%96%AF

posted on 2021-11-12 08:45  凯鲁嘎吉  阅读(13710)  评论(0编辑  收藏  举报