摘要: 总的来说,概率论的体系是比较简单的。我觉得可以归纳为下面几个点:1. 公理体系,2. 典型分布,3. 描述量,4. 普适定律。在概率论的系列文章,或者是任何概率论的教材中,都会涉及这四个方面。 概率论的难点可能在于它的公理体系。它的叙述非常简单,但不容易把握。要知道,在概率论初期发展的一两百年... 阅读全文
posted @ 2014-04-10 15:37 蚂蚁拉车 阅读(550) 评论(0) 推荐(0) 编辑
摘要: 在整个概率论中,核心的问题是随机变量的分布。正如我们在离散分布和连续分布中看到的,分布有许多种类。更夸张的是,在满足概率公理的前提下,我们完全可以自行设计分布。想像一下,如果有一天数学书上印一个自己设计的分布,这是多么美好的事情啊!然而,这一愿望并不那么容易实现。那些 “名流”分布,比如“泊松”,“高斯”,“伯努利”分布,往往在理论上很重要,所以得到了数学家的深入研究。“知名”分布的特性(比如它们的期望、方差、 累计概率函数)可以很容易在数学手册中找到,这些研究成果也成为概率论“军火库”的重要部分。 另一方面,概率分布是否存在什么共性呢?我们的许多结论都是依赖于分布的具体类型。对于一个分... 阅读全文
posted @ 2014-04-10 15:33 蚂蚁拉车 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 我们重新回到对单随机变量分布的研究。描述量是从分布中提取出的一个数值,用来表示分布的某个特征。之前使用了两个描述量,即期望和方差。在期望和方差之外,还有其它的描述量吗?斜度 值得思考的是,期望和方差足以用来描述一个分布吗?如果答案是可以,那么我们就没有必要寻找其它描述量的。事实上,这两个描述量并不足以完整的描述一个分布。 我们来看两个分布,一个是指数分布: 它的期望为E(x)=1,方差为D(x)=1。 们用Y = 2-X来获得一个新的随机变量,及其分布: 该密度曲线与原来的密度曲线关于直线X=1对称,与原来的分布有相同的期望值和方差.E(x)=1,方差为D(x)=1我们绘制两个分... 阅读全文
posted @ 2014-04-10 15:06 蚂蚁拉车 阅读(4862) 评论(1) 推荐(1) 编辑
摘要: 前面介绍的分布描述量,比如期望和方差,都是基于单一随机变量的。现在考虑多个随机变量的情况。我们使用联合分布来表示定义在同一个样本空间的多个随机变量的概率分布。 联合分布中包含了相当丰富的信息。比如从联合分布中抽取某个随机变量的边缘分布,即获得该随机变量的分布,并可以据此,获得该随机变量的期望和方差。这样做是将视线限制在单一的一个随机变量上,我们损失了联合分布中包含的其他有用信息,比如不同随机变量之间的互动关系。为了了解不同随机变量之间的关系,需要求助其它的一些描述量。协方差 协方差(covariance)表达了两个随机变量的协同变化关系。我们取一个样本空间,即学生的体检数据。学生的身高... 阅读全文
posted @ 2014-04-10 14:26 蚂蚁拉车 阅读(2380) 评论(0) 推荐(0) 编辑
摘要: 除了期望,方差(variance)是另一个常见的分布描述量。如果说期望表示的是分布的中心位置,那么方差就是分布的离散程度。方差越大,说明随机变量取值越离散。 比如射箭时,一个优秀的选手能保持自己的弓箭集中于目标点附近,而一个经验不足的选手,他弓箭的落点会更容易散落许多地方。 上面的靶上有两套落点。尽管两套落点的平均中心位置都在原点 (即期望相同),但两套落点的离散程度明显有区别。蓝色的点离散程度更小。 数学上,我们用方差来代表一组数据或者某个概率分布的离散程度。可见,方差是独立于期望的另一个对分布的度量。两个分布,完全可能有相同的期望,而方差不同,正如我们上面的箭靶。 方差 对于一... 阅读全文
posted @ 2014-04-10 14:05 蚂蚁拉车 阅读(1570) 评论(0) 推荐(0) 编辑
摘要: 描述量 描述随机变量最完备的方法是写出该随机变量的概率分布。然而,正如我们在前面章节看到的,概率分布的表达往往都比较复杂,信息量很大。这如同我们购置汽车的时候,一辆汽车的全面数据可以说是海量的,比如汽车尺寸,油箱大小等等。我们选择一辆汽车时,往往只使用有限的几个具有代表性的量来代表汽车的主要特征,比如排气量,最大马力。我们信赖这几个量, 因为它们可以“粗糙”的描述汽车的主要性能。这些量是汽车全面数据的一个缩影。 类似的,统计学家也设计了这样的投影系统,将全面的概率分布信息量投射到某几个量上,来代表随机变量的主要特征,从而掌握该随机变量的主要“性能”。这样的一些量称为随机变量的描述量(des.. 阅读全文
posted @ 2014-04-10 11:01 蚂蚁拉车 阅读(685) 评论(0) 推荐(0) 编辑