随笔分类 - 数学
1
摘要:结束了概率,下面开始统计。这一篇,是统计的一个小介绍。 统计是研究数据的学科。它包括描述数据,推测群体信息,判断假设的真伪。统计是一门实用学科。人们利用统计,寻找下一个NBA巨星,推测奥斯卡奖项,寻找自己的真心伴侣。在电影“点球成金”中,球队的经理就是利用统计思想,来搜寻球员,管理球队,最终...
阅读全文
摘要:总的来说,概率论的体系是比较简单的。我觉得可以归纳为下面几个点:1. 公理体系,2. 典型分布,3. 描述量,4. 普适定律。在概率论的系列文章,或者是任何概率论的教材中,都会涉及这四个方面。 概率论的难点可能在于它的公理体系。它的叙述非常简单,但不容易把握。要知道,在概率论初期发展的一两百年...
阅读全文
摘要:在整个概率论中,核心的问题是随机变量的分布。正如我们在离散分布和连续分布中看到的,分布有许多种类。更夸张的是,在满足概率公理的前提下,我们完全可以自行设计分布。想像一下,如果有一天数学书上印一个自己设计的分布,这是多么美好的事情啊!然而,这一愿望并不那么容易实现。那些 “名流”分布,比如“泊松”,“高斯”,“伯努利”分布,往往在理论上很重要,所以得到了数学家的深入研究。“知名”分布的特性(比如它们的期望、方差、 累计概率函数)可以很容易在数学手册中找到,这些研究成果也成为概率论“军火库”的重要部分。 另一方面,概率分布是否存在什么共性呢?我们的许多结论都是依赖于分布的具体类型。对于一个分...
阅读全文
摘要:我们重新回到对单随机变量分布的研究。描述量是从分布中提取出的一个数值,用来表示分布的某个特征。之前使用了两个描述量,即期望和方差。在期望和方差之外,还有其它的描述量吗?斜度 值得思考的是,期望和方差足以用来描述一个分布吗?如果答案是可以,那么我们就没有必要寻找其它描述量的。事实上,这两个描述量并不足以完整的描述一个分布。 我们来看两个分布,一个是指数分布: 它的期望为E(x)=1,方差为D(x)=1。 们用Y = 2-X来获得一个新的随机变量,及其分布: 该密度曲线与原来的密度曲线关于直线X=1对称,与原来的分布有相同的期望值和方差.E(x)=1,方差为D(x)=1我们绘制两个分...
阅读全文
摘要:前面介绍的分布描述量,比如期望和方差,都是基于单一随机变量的。现在考虑多个随机变量的情况。我们使用联合分布来表示定义在同一个样本空间的多个随机变量的概率分布。 联合分布中包含了相当丰富的信息。比如从联合分布中抽取某个随机变量的边缘分布,即获得该随机变量的分布,并可以据此,获得该随机变量的期望和方差。这样做是将视线限制在单一的一个随机变量上,我们损失了联合分布中包含的其他有用信息,比如不同随机变量之间的互动关系。为了了解不同随机变量之间的关系,需要求助其它的一些描述量。协方差 协方差(covariance)表达了两个随机变量的协同变化关系。我们取一个样本空间,即学生的体检数据。学生的身高...
阅读全文
摘要:除了期望,方差(variance)是另一个常见的分布描述量。如果说期望表示的是分布的中心位置,那么方差就是分布的离散程度。方差越大,说明随机变量取值越离散。 比如射箭时,一个优秀的选手能保持自己的弓箭集中于目标点附近,而一个经验不足的选手,他弓箭的落点会更容易散落许多地方。 上面的靶上有两套落点。尽管两套落点的平均中心位置都在原点 (即期望相同),但两套落点的离散程度明显有区别。蓝色的点离散程度更小。 数学上,我们用方差来代表一组数据或者某个概率分布的离散程度。可见,方差是独立于期望的另一个对分布的度量。两个分布,完全可能有相同的期望,而方差不同,正如我们上面的箭靶。 方差 对于一...
阅读全文
摘要:描述量 描述随机变量最完备的方法是写出该随机变量的概率分布。然而,正如我们在前面章节看到的,概率分布的表达往往都比较复杂,信息量很大。这如同我们购置汽车的时候,一辆汽车的全面数据可以说是海量的,比如汽车尺寸,油箱大小等等。我们选择一辆汽车时,往往只使用有限的几个具有代表性的量来代表汽车的主要特征,比如排气量,最大马力。我们信赖这几个量, 因为它们可以“粗糙”的描述汽车的主要性能。这些量是汽车全面数据的一个缩影。 类似的,统计学家也设计了这样的投影系统,将全面的概率分布信息量投射到某几个量上,来代表随机变量的主要特征,从而掌握该随机变量的主要“性能”。这样的一些量称为随机变量的描述量(des..
阅读全文
摘要:随机变量的函数 在前面的文章中,我先将概率值分配给各个事件,得到事件的概率分布。 通过事件与随机变量的映射,让事件“数值化”,事件的概率值转移到随机变量上,获得随机变量的概率分布。 我们使用随机变量的函数,来定制新的随机变量。随机变量的函数是从旧有的随机变量到一个新随机变量的映射。通过函数的映射功能,原有随机变量对应新的随机变量。通过原有随机变量的概率分布,我们可以获知新随机变量的概率分布。事件,随机变量,随机变量函数的关系如下: 一个简单的例子是掷硬币。出现正面的话,我赢1个筹码,负面的话,我输1个筹码。那么,投掷一次,赢的筹码数是一个随机变量X,X可能取值为1和-1。因此X的分...
阅读全文
摘要:联合分布(joint distribution)描述了多个随机变量的概率分布,是对单一随机变量的自然拓展。联合分布的多个随机变量都定义在同一个样本空间中。 对于联合分布来说,最核心的依然是概率测度这一概念。离散随机变量的联合分布 我们先从离散的情况出发,了解多个随机变量并存的含义。 之前说,一个随机变量是从样本空间到实数的映射。然而,所谓的映射是人为创造的。从一个样本空间,可以同时产生多个映射。比如,我们的实验是连续三次投硬币,样本空间为 h为正面,t为反面。在同一样本空间上,我们可以定义多个随机变量,比如:X:投掷为正面的总数,可以取值0,1,2,3Y:最后一次出现负面的总数,可...
阅读全文
摘要:相对于离散随机变量,连续随机变量可以在一个连续区间内取值。比如一个均匀分布,从0到1的区间内取值。一个区间内包含了无穷多个实数,连续随机变量的取值就有无穷多个可能。 为了表示连续随机变量的概率分布,我们可以使用累积分布函数或者密度函数。密度函数是对累积分布函数的微分。连续随机变量在某个区间内的概率可以使用累积分布函数相减获得,即密度函数在相应区间的积分。 在随机变量中,我们了解了一种连续分布,即均匀分布(uniform distribution)。这里将罗列一些其他的经典连续分布。指数分布 指数分布(exponential distribution)的密度函数随着取值的变大而指数减小...
阅读全文
摘要:我们已经知道什么是离散随机变量。离散随机变量只能取有限的数个离散值,比如投掷一个撒子出现的点数为随机变量,可以取1,2,3,4,5,6。每个值对应有发生的概率,构成该离散随机变量的概率分布。 离散随机变量有很多种,但有一些经典的分布经常重复出现。对这些经典分布的研究,也占据了概率论相当的一部分篇幅。我们将了解一些离散随机变量的经典分布,了解它们的含义和特征。伯努利分布 伯努利分布(Bernoulli distribution)是很简单的离散分布。在伯努利分布下,随机变量只有两个可能的取值: 1和0。随机变量取值1的概率为p。相应的,随机变量取值0的概率为1-p。因此,伯努利分布可以表示...
阅读全文
摘要:我们了解了“样本空间”,“事件”,“概率”。样本空间中包含了一次实验所有可能的结果,事件是样本空间的一个子集,每个事件可以有一个发生的概率。概率是集合的一个“测度”。 这一讲,我们将讨论随机变量。随机变量(random variable)的本质是一个函数,是从样本空间的子集到实数的映射,将事件转换成一个数值。根据样本空间中的元素不同(即不同的实验结果),随机变量 的值也将随机产生。可以说,随机变量是“数值化”的实验结果。在现实生活中,实验结果可以是很“叙述性”,比如“男孩”,“女孩”。在数学家眼里,这些文字化的叙述太过繁琐,我们为什么不能拿数字来代表它们呢?(数学家恐怕是很难成为文学家吧...
阅读全文
摘要:在概率公理中,我们建立了“概率测度”的概念,并使用“面积”来类比。这是对概率的第一步探索。为了让概率这个工具更加有用,数学家进一步构筑了“条件概率”,来深入探索概率中包含的数学结构。我们可以考虑生活中常见的一个估计: 三个公司开发一块地。A占地20%,B占地30%,C占地50%。三个公司规划的绿地占比不同:A土地中40%规划为绿地,B土地中的30%规划为绿地,C土地中的10%规划为绿地。我想选择绿地最大的一个小区,应该选择哪一个呢?我们可以画图出来: 显然,我们需要比较的是A:0.2x0.4,B:0.3x0.1,C:0.5x0.1。这是我们常见的一种情形:整个地区分块,每块有一定的比例...
阅读全文
摘要:概率论早期用于研究赌博中的概率事件。赌徒对 于结果的判断基于直觉,但高明的赌徒尝试从理性的角度来理解。然而,赌博中的一些结果似乎有矛盾。比如掷一个骰子,每个数字出现的概率相等,都是1/6。 然而,如果有两个骰子,那么出现的2到12这些数字的概率却不相同。概率论这门学科正是为了搞清楚这些矛盾背后的原理。 早期的概率论是一门混合了经验的数学学科,并没有严格的用语。因此,概率论在数学的精密架构下,显得有些异类。许多名词,如“概率”等,一定程度上是按照人们的直觉来定义的。1933年,俄国数学家 AndreiN.Kolmogorov建立了概率论的公理化体系,严格定义了概率论的语言。正如现代数学的其...
阅读全文
摘要:概率 概率论研究的是随机或者说不确定事件。 它最早产生于赌徒对赌博结果的研究,(即使是今天,概率论也经常用于赌博)。既然是随机的事件,那么结果是否就只能凭运气呢?高明的赌徒发现了赌博中的一 些规律。投掷两个撒子买大小是常见的赌博游戏。赌徒发现,如果重复很多次,那么出现总数为2的次数会比总数7少。尽...
阅读全文
摘要:1.1《数学分析》:复旦,陈纪修,214集,151小时 http://www.youku.com/playlist_sh ... ode_pic_page_1.html http://www.youku.com/playlist_show/id_3657450.html 1.2《数学分析》:中科大,史济怀,203集,149小时 http://www.youku.com/playlist_sh ... ode_pic_page_1.html 1.3《微积分》:清华,58集,47小时 ...
阅读全文
摘要:最近不是忙就是懒,还病了好长时间。本来打算好好看看概率,结果断断续续的一直也没安下心来。今天正好没什么事,整理下概率的笔记吧。第一章:事件与概率确定性现象:实验之前就能断定有一个确定性结果。随机试验的三个必要条件:1、可以在相同情况下重复进行。 2、所有可能的结果是明确知道的且不止有一个。 3、每次总是恰好出现可能结果中的一个,但不确定是哪一个。基本事件:每一个可能的结果。其全体称为样本空间,每一个基本事件称为样本点。复杂事件:由多个基本事件组成的事件。对立事件:A发生导致B不发生,反之亦然。概率中的概念和集合论中概念的联系。德摩根定律(对偶原则...
阅读全文
摘要:过去的一段时间事情多,人也烦,想安安静静研究点东西总是很难。到今天总算把高代给看完了,看的很粗,只是熟悉了一下定理的定义和用法,证明和例题以及课后题都没怎么看,哎,当年为了考研,这些例题和课后题说不上倒背如流起码能达到一看题不用思考就能默写出答案来,现在想硬着头皮看明白都感觉很费劲,时间果然是一个无情的小偷,不经意间就会拿走本属于我们的东西。好了,不废话了,继续复习吧。------------------------------------------------------------我是淫荡的分割线--------------------------------------------..
阅读全文
摘要:代数余子式 范德蒙德行列式及其乘积 克拉默法则:系数矩阵不为零,则方程组有唯一解即解的形式 齐次线性方程组 拉普拉斯定理:行列式中K行元素组成的一切K级子式与其代数余子式的乘积等于此行列式。可对矩阵进行降阶。三、线性方程组 一般线性方程组求解:利用初等变换。 增广矩阵 线性组合 向量组等价 极大线性无关组 基础解系四、矩阵 一般情况下:AB不等于BA |A|不等于0称为非退化A的秩为零 伴随矩阵 可逆 利用初等变换求A的逆五、二次型 二次型 对称矩阵 将二次型用矩阵的乘积表示出来X'AX AB合同存在C使得B=C'AC 标准二次型 正定二次型 正...
阅读全文
摘要:今天看了一句话:程序员是所有行业中最能抗压和抗穷的职业人群,也只有程序员能在前期创业阶段明知前方是万丈悬崖依然选择蒙眼猛进,哪怕粉身碎骨也在所不辞。但程序员们创业初期最怕的不是暂时性的入不敷出,而是团队成员的各种原因的“被离去”,这种始于外界因素或者压力造成的队友离去,会给团队其他成员造成一种极强的“虚空感”,这种虚空感在最原始团队成员中最能体现出来。 博客就写一些概念性的东西吧,公式和推理实在懒得往上打了。以后尽量抽时间将进度往上发一下。 第一章:多项式: 数的发展过程:自然数-->有理数-->实数-->复数 数域:若P为由复数组成的集合,若P中任意两数的和、差、积、商(除
阅读全文
1