卡方分布

样本均值与样本方差

样本均值:$\overline{X}=\frac{\sum_{i=1}^k X_i}{k}$

样本方差:$Var(X)=\frac{\sum_{i=1}^k |X_i-\overline{X}|}{k}$

正态分布

$f(x|\mu,\sigma^2)=\frac{1}{(2\pi)^1/2}exp[-\frac{1}{2}(\frac{x-\mu}{\sigma})^2]$ , $\mu$为均值,$\sigma$为标准差,$\mu$决定了中心轴的位置,$\sigma$决定了函数的高度。

标准正态函数:

$f(x|0,1)=\frac{1}{(2\pi)^1/2}exp(-\frac{1}{2}x^2)$ 

伽马分布

首先说说伽马分布的由来,伽马分布是基于著名的伽马函数推导而来,过程如下

$\Gamma(a)=\int_0^\infty  {x^{a-1}e^{-x}dx}\quad\quad\text{伽马函数}$

$\Gamma(n)=(n-1)\Gamma(n-1)=(n-1)!\Gamma(1)$

$\Gamma(\frac{1}{2})=\pi^{\frac{1}{2}}$

设$x = \mu \beta  = \varphi (\mu )$

根据$x = \varphi (\mu ),\int {f(x)g(x)} dx = \int {f \circ } \varphi (\mu )g \circ \varphi (\mu )\varphi '(\mu )$

得到:$\Gamma (a) = {\beta ^a}\int_0^\infty  {{\mu ^{a - 1}}{e^{ - \mu \beta }}d\mu } $

所以伽马分布(概率密度函数)为: $f(\mu|a,\beta)=\frac{\beta ^a}{\Gamma (a)} {\mu ^{a - 1}}{e^{ - \mu \beta }}$

这样,在对 $f(\mu|a,\beta)$求$\int_0^{+\infty}$的时候(伽马分布的概率分布函数),结果永远等于1.

卡方分布

  公式:$f(x) = \frac{1}{{{2^{n/2}}\Gamma (n/2)}}{x^{n/2 - 1}}{e^{ - x/2}}$

这是一个自由度为2的卡方分布,其实是一个$\Gamma$分布的变形,当$\alpha  = 1$ , 并且$\beta  = 1/2$的$\Gamma$分布。

为什么要叫卡方分布呢?这个公式又跟正态分布有千丝万缕的关系,对于一个随机变量$X$,服从标准正态分布,则$X$的随机变量的平方$Y=X^2$便服从自由度为1的卡方分布,推导过程略去,自由度该如何取值呢? 如果一个随机变量自由度就是1,如果是$X_1....X_k$自由度就是k了,并且$X_1^2....X_k^2$服从自由度为k的卡方分布。就是正态分布的随机变量的平方就是卡方分布。

posted @ 2013-11-09 15:22  KimSky  阅读(5739)  评论(0编辑  收藏  举报