P 值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。
统计学的观点,超过一定基准(比如 5%,其实是低于5%),就不能简单地认为这是偶然事件了,而是受到了外在的影响。

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检验

通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少百分比的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

  • 如果 P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
  • 如果 0.01<P值<0.05,说明较弱的判定结果,拒接假定的参数取值。
  • 如果 P值>0.05,说明结果更倾向于接受假定的参数取值。

比如一枚均质硬币,抛 10 次:

  • 有 8 次正面的概率为 (108)+(109)+(1010) > 5%
  • 有 9 次正面的概率为 (109)+(1010) < 5%

1. 实际应用

在比如这样一个问题,某公司声称研制了一种系统,对此地的犯罪事件进行预测成功的概率为 70%,已知某天的 14 起案件预测对了 13 件,那么统计学意义上,公司是否谎报了自己的数据呢?

(1413)0.7130.31+(1414)0.714=0.04069+0.00678<5%

posted on 2016-08-26 14:52  未雨愁眸  阅读(751)  评论(0编辑  收藏  举报