【初等概率论】 04 - 数字特征
随机变量的分布函数包含了它的全部信息,随之我们就需要对随机变量进行一些定量分析,即通过相对简单的数值来度量随机变量的某些特征。有些特征对于随机变量来说比较基本、比较重要,比如平均值、分散程度等,本篇就集中讨论这些特征。
1. 数学期望
1.1 期望的定义
随机变量可取到一些实数值,对其最常用的一种度量便是平均值,而每个值上的概率(或概率密度)应当作为权值。具体来说,在离散场合,把式(1)右定义为随机变量
对连续场景,密度函数与本质上就是概率分布,故可将式(1)推广成式(2)左。当它绝对收敛时,也被称为
把平均值叫成数学期望其实是有道理的,因为对随机现象来说,它就是理论上的期望值。数学期望是对随机向量最基本的一个度量值,单一的度量值更便于应用,它存在于社会经济的各方面,为经济行为提供了决策的依据。
• 已知人群中某疾病的患病率为
• 有无限多的
•
1.2 变量函数的期望
对随机变量的讨论,总离不开对其函数的分析,这里也照例看看随机变量函数的数学期望。如果理解了数学期望的定义,便知道它其实就是加权平均值,在这里变量函数就是值,而变量的概率还是权值,故函数的期望一定是式(3)所示。当然这只是一个直观解释,严格证明还是需要实变函数的知识。
式(3)一般计算起来比较困难,但利用积分运算的特点,在有些常见情况下可以简化运算。首先如果
式(4)的典型特例是式(6)左,其中
•
• (报童问题)卖报数服从泊松分布,求每天进多少张收益最大。
2. 方差
2.1 矩和方差
数学期望
矩在数学里有多类似的概念,是一个很常规的度量,这里仅作简单的讨论。
和期望一样,矩也要先讨论存在性,由于
当
关于方差和标准差,我有些自己的理解,可能不太准确。下面我们难免会拿线性代数中的向量和随机变量做对比,我想在这里先建立一个直观的联系。向量可以看做是相对原点的一个偏移,标准化向量则是统一了偏移的绝对值而保利了方向信息。随机变量则可以看作是相对期望值的偏移,标准差是统一了偏移的绝对值而保留了分布信息。由此可见,中心矩比零点矩有更实际的意义,对随机变量做中心化处理往往是必须的。
2.2 方差的性质
刚才提到方差具有很好的分析性质,这里就举一些简单的例子,并且这些结论以后也是经常用到的。首先有一个简单的不等式(10),它表明中心是与随机变量偏差最小的值,这也很符合“中心”的含义,用中心化的随机变量的
方差表示随机变量对中心的偏移程度,这个描述有更具体的佐证吗?还真有!结论表明,方差可以用来估算随机变量在中心周围的分布。具体来看式(11)的推导,其中
最后还是照例看看,随机变量的函数的方差如何计算。方差的计算比期望复杂的多,故函数的方差很难有好的性质,并且目前我们的工具还不够。这里就先讨论最简单的一元一次函数
2.3 协方差和相关系数
当研究线性函数的方差
为此,我们很兴奋地大胆猜测,标准化后的协方差(式(17))一定也是随机向量某种“线性关系”的度量。我们需要对此做进一步的验证,为简单起见,只需讨论中心化后的变量
有柯西不等式立刻能得到
到此为止,我们可以继续研究方差
由于不相关仅针对线性关系,它是比独立性更弱的条件,也就是说独立的随机变量一定是不相关的,这可以由等价条件
• 有两只铅笔,同样只测量两次,如何降低误差?
2.4 线性回归
现在来考虑一个问题,假定随机变量
以上回归模型要求能提供条件分布,这对样本点有一定要求,当样本点在每个变量上都比较随机时,则无法使用。但当预估
3. 特征函数
3.1 母函数
虽然分布函数给出了概率分布的统一形式,但很多分布函数并没有良好的分析性质,这也使得它的应用非常受限。我们急需要一种新的函数,它既能完整表达整个概率分布,又具有十分良好的分析性质。对非负离散随机变量,我们不难想到数列的母函数,由概率分布的规范性知,式(25)在
母函数有着非常好的分析性质,尤其一些常见分布的母函数也很简洁,这为处理问题提供了方便,甚至可以用母函数取代概率分布。一个很有用的结论是式(26),利用它们可以方便地计算期望和方差。
按照惯例,引入一个新特征,总要考察一下变量函数的特征。在这里不难证明,对独立随机变量
最后再来看个问题,对于独立同步变量
• 掷5颗筛子,求和为
• 蚕的产卵数服从泊松分布,每个卵成虫律为
3.2 特征函数
母函数虽然好用,但它只能运用在离散随机变量,对于连续随机变量或更一般的情况,有没有类似的工具呢?如果你学过傅里叶分析,应当知道傅里叶变换就是母函数思想的升级版本,为此我们把式(27)称为随机变量
和母函数一样,对独立随机变量
仔细观察式(28),特征函数中的幂函数将加法变成乘法,但很多变量的特征函数仍保持着幂函数成分,乘法此时还能变成加法。具体来说,如果含参分布
对于随机向量
随机变量还有一个非常重要的度量方法,就是考察其“不确定性”的程度、或者包含的“信息量”。可想而知,这个量与期望、方差都没有关系,它只关乎“随机程度”。这个概念叫“熵”,它是一个非常有趣且丰富的课题,属于概率论的一个应用分支。缺少“熵”的概念并不影响概率论本身,故这里不作介绍,以后会在《信息论》中展开讨论。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架