【统计学】
一、前言
1、条件概率
书写形式:P(A|B),表示在条件B下A出现的概率。
2、相关事件和独立事件
3、用好图表
二、描述统计
目的是描述数据特征,找出数据的基本规律,举例如下:
三、推断统计
统计学本质:用样本的统计量推断总体的参数
1、统计学的两大定理:大数定律和中心极限定理
大数定律:在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值(即总体均值)。 通俗的说就是,样本n越大,样本均值几乎等于总体均值。
中心极限定理:给定任意分布的总体,每次从总体中随机抽取 n 个样本,共抽 m 次。 这m组样本均值的分布近似服从正态分布。
2、抽样
抽样误差大小:分层抽样<系统抽样<简单随机抽样<整群抽样
抽样误差和标准误差
标准差和标准误的区别:标准差衡量样本个体之间的差异程度,标准误衡量样本均值和总体均值的差异程度
3、参数估计
参数估计是用样本统计量去估计总体的参数。
4、假设检验
案例:有一天,宝强怀疑妻子有可能出轨,于是进行假设检验。
【第二步】证据是什么
根据中心极限定理,我们知道,合理足够多的样本可以代表总体。所以我要找到马蓉合理的样本数据来做证据。
接下来,我随机调查了马蓉这几年的样本数据,包括上网,开房,财务等。
根据这些样本数据显示出来的证据,我利用自己的统计概率知识,计算出了,在零假设成立的前提下,马蓉没有出轨的概率P=0.01%。
四、抽样分布
5、常见分布
五、方差分析和回归分析