数学-n个互相独立的连续随机变量中第i小的数值期望
6.4.2020 updated:
现在回看了一下当时自己…哎……
整半天原来可以直接调用已有结论……加在文末了……
提出问题
有 \(n\) 个互相独立的 \(0\) 至 \(1\) 之间等概率生成的随机变量,求从小到大排序后第 \(i\) 个数的数值期望
一个简化的问题
我们先来求解一个简化的问题:最大值的数值期望是多少?
我们会发现,由于这些变量都是在 \(0\) 到 \(1\) 之间等概率生成的,所以一个变量小于等于 \(x\) 的概率为 \(x\)(即 \(P(x_0\leq x)=x\)),则这 \(n\) 个数中最大值为 \(x\) 的概率为 \(x^{n-1}\)(其他 \(n-1\) 个变量都小于等于 \(x\))
再考虑到有 \(n\) 个数都有可能成为最大值,所以最后答案还要再乘\(\binom n1\)(实际上这个组合数应该放在原式的概率函数 \(p(x)\) 里的,但为了表达方便,我们将这个组合数提到最外面最后进行计算,后面的运算也是如此)
由于期望的计算公式为
套到这题里就是
乘上组合数,得到这个简化问题的答案为 \(\frac n{n+1}\)
扩展
我们现在求得了最大值(第 \(n\) 个数)的数值期望为 \(\frac n{n+1}\),同理可以计算出最小数(第 \(1\) 个数)的数值期望为 \(\frac 1{n+1}\),由期望的线性性大胆猜想第 \(i\) 个数的数值期望为 \(\frac i{n+1}\)
下面来证明这个式子
类比上面求最大值的解法,我们可以很容易地列出我们需要的式子
(第 \(i\) 个数为 \(x\) 的概率为前 \(i-1\) 个数都小于等于 \(x\),后 \(n-i\) 个数都大于等于 \(x\),则概率为 \(x^{i-1}\cdot (1-x)^{n-i}\))
这个式子在最后还要乘一个 \(n\cdot \binom {n-1}{i-1}\)(\(n\) 个数都有可能成为第 \(i\) 个数,还要再选出小于等于 \(x\) 的 \(i-1\) 个数)
我们列出了式子,但这个式子并不像 \(x^n\) 这样好积分;为此,我们考虑分部积分:
积分
明确目标,我们要求
代 \(\begin{cases}u=(1-x)^{n-i}\\v'=x^i\end{cases}\)
则原式即为
由于 \(uv\) 在 \(x=0\) 或 \(1\) 时都为零,则只需要考虑后面的式子即可:
数列
发现这个式子和原式长得很像,可以对比一下:
设 \(a_i=\int_0^1 x^i(1-x)^{n-i}\cdot \mathrm dx\),则可以得到一个有趣的递推式 \(a_i=\frac {n-i}{i+1}\cdot a_{i+1}\),而边界条件即为一开始证明的式子 \(a_n=\frac n{n+1}\)
从而可以得到 \(a_i\) 的通项公式 \(a_i=\frac {i!(n-i)!}{(n+1)!}\)
所以前面那一长溜的积分式,可以化简为 \(\frac {i!(n-i)!}{(n+1)!}\)
最后不要忘记之前提取出来的组合系数 \(n\cdot \binom {n-1}{i-1}\)
解得的答案为 \(\frac {i!(n-i)!}{(n+1)!}\cdot n\cdot \binom {n-1}{i-1}=\frac i{n+1}\)
猜想得证
结论
有 \(n\) 个互相独立的 \(0\) 至 \(1\) 之间等概率生成的随机变量,求从小到大排序后第 \(i\) 个数的数值期望为 \(\frac i{n+1}\)
可以推广,若变量的生成范围为 \([l,r]\),则第 \(i\) 小数的数值期望为 \(l+\frac {i\cdot(r-l)}{n+1}\)
最近加了友链的一位同学知道一个比较简单的组合解释,果真还是老了啊
updated:\(\Gamma\) 函数与 \(B\) 函数
上面整这半天实际上可以用已有结论:
引入 \(Gamma\) 函数与 \(Beta\) 函数:
有几个结论:
- \(\Gamma(1)=1\) 且 \(\Gamma(x+1)=x\Gamma(x)\),故 \(\Gamma(x+1)=x!(x\in \mathbb Z)\)
- \(B(x,y)=\frac {\Gamma(x)\Gamma(y)}{\Gamma(x+y)}\)
然后考虑到之前关键求的是
然后直接套结论就好了……还是数学没学好的说……(不过问了好几位dalao都没人提这玩意TAT)