随笔分类 - 统计学
统计学系列内容整理
摘要:蒙特卡洛方法是一类基于随机抽样的数值计算技术,通过模拟随机事件的概率过程,从而近似计算复杂问题的数学期望或积分。其核心思想是通过大量的随机抽样来逼近问题的解,从而在随机性中获得问题的统计特性。蒙特卡洛方法广泛应用于概率统计、物理学、金融工程、生物学等领域。 在蒙特卡洛模拟中,通过生成符合特定分布的随
阅读全文
摘要:假设检验(Hypothesis Testing)是一种统计学的核心机制或模式,用于评估一个假设是否成立,基于样本数据来推断总体的特性。假设检验的基本思路是将研究的问题转化为两个互为对立的假设:原假设(Null Hypothesis, )和备择假设(Alternative Hypothe
阅读全文
摘要:正交试验设计(orthogonal design简称正交设计(orthoplan),是利用正交表(orthogonal table)科学地安排与分析多因素试验的方法,是最常用的试验设计之一。正交表(Orthogonal Array, OA)是一种用于实验设计的矩阵,它通过系统化的排列组合方法帮助研究
阅读全文
摘要:双因素方差分析(Double factor variance analysis) 有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者
阅读全文
摘要:方差分析是由英国著名统计学家:R.A.Fisher推导,也叫F检验,用于多个样本间均数的比较(分析类别变量、有序变量)。当包含的因子是解释变量时,关注的重点通常会从预测转向组别差异的分析。方差分析是一种能使多因素(多组间)检验变得简洁的一种检验方式,它能同时考虑所有的样本,不仅能使检验过程变得简洁还
阅读全文
摘要:在统计数据分析中,异常值指的是在数据集中显得特别偏离或不符合整体趋势的观测值。它们可能由于种种原因与大多数数据点存在明显差异,如测量误差、录入错误、极端事件或特殊情况等。异常值的存在可以对数据分析的结果产生显著影响,有时会扭曲平均值、增加方差,甚至改变分析结论。因此,识别和处理异常值是数据分析中的重
阅读全文
摘要:提到弗朗西斯·高尔顿,人们通常会联想到他的钉板实验(也称为高尔顿板),以及他作为查尔斯·达尔文的表弟的身份。然而,弗朗西斯·高尔顿的贡献远远不止于此,他是维多利亚时代的集大成者,横跨多个领域:人类学、统计学、心理学、遗传学、地理学、发明学和气象学,同时也是一位热带探险家和地理学家。他的广泛兴趣和跨学
阅读全文
摘要:中心极限定理,是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都
阅读全文
摘要:在人们的生活中,很多场景都需要用到随机数,例如福利彩票,车牌摇号,公共用房分配等。在用数学模型, 包括概率统计模型处理实际应用中的问题时, 我们希望建立的模型能够尽可能地符合实际情况。但是,实际情况是错综复杂的,如果一味地要求模型与实际完全相符,会导致模型过于复杂,以至于不能进行严格理论分析。所以实
阅读全文
摘要:正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布,例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身
阅读全文
摘要:正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是
阅读全文
摘要:统计模拟是数理统计、和计算机科学的结合,是一门综合性学科。在科学研究和生产实际的各个领域中,普遍存在着大量数据的分析处理工作。如何应用数理统计中的方法来解决实际问题,以及如何解决在应用中出现的计算问题,对实际工作者来说是极需要解决的问题。统计模拟正是力求把统计思想、数值计算及在计算机上的实现结合起来
阅读全文