摘要:
置信区间 先来介绍一下置信区间的预备知识: 对于正态分布而言,有3σ原则,也就是数值分布在(μ-σ,μ+σ)中的概率为0.6827;数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;数值分布在(μ-3σ,μ+3σ)中的概率为0.9974。 其中μ为样本均值,σ为样本标准差。 而2σ时概率分布已 阅读全文
摘要:
摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向 阅读全文
摘要:
中心极限定理指的是给定一个任意分布的总体。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。 我们先举个栗子现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一 阅读全文
摘要:
1. 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)。 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言: 伯努利试验都可以表达为“是或否”的问题。例如,抛一 阅读全文
摘要:
我们知道统计学包括描述性统计和推论统计,而今天的主题是描述性统计的介绍。 什么是描述性统计呢?维基百科的定义: "A descriptive statistic is a summary statistic that quantitatively describes orsummarizes fea 阅读全文