P 值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。
统计学的观点,超过一定基准(比如 5%,其实是低于5%),就不能简单地认为这是偶然事件了,而是受到了外在的影响。
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检验。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少百分比的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
- 如果 P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
- 如果 0.01<P值<0.05,说明较弱的判定结果,拒接假定的参数取值。
- 如果 P值>0.05,说明结果更倾向于接受假定的参数取值。
比如一枚均质硬币,抛 10 次:
- 有 8 次正面的概率为
(108)+(109)+(1010) > 5% - 有 9 次正面的概率为
(109)+(1010) < 5%
1. 实际应用
在比如这样一个问题,某公司声称研制了一种系统,对此地的犯罪事件进行预测成功的概率为 70%,已知某天的 14 起案件预测对了 13 件,那么统计学意义上,公司是否谎报了自己的数据呢?