P 值（p value）与统计检验 - 未雨愁眸

公告

P 值是最常用的一个统计学指标，几乎统计软件输出结果都有P值。
统计学的观点，超过一定基准（比如 5%，其实是低于5%），就不能简单地认为这是偶然事件了，而是受到了外在的影响。

一般而言，为了确定从样本（sample）统计结果推论至总体时所犯错的概率，我们会利用统计学家所开发的一些统计方法，进行统计检验。

通过把所得到的统计检定值，与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较，我们可以知道在多少百分比的机会下会得到目前的结果。倘若经比较后发现，出现这结果的机率很少，亦即是说，是在机会很少、很罕有的情况下才出现；那我们便可以有信心的说，这不是巧合，是具有统计学上的意义的（用统计学的话讲，就是能够拒绝虚无假设null hypothesis,Ho）。相反，若比较后发现，出现的机率很高，并不罕见；那我们便不能很有信心的直指这不是巧合，也许是巧合，也许不是，但我们没能确定。

如果 P<0.01，说明是较强的判定结果，拒绝假定的参数取值。
如果 0.01<P值<0.05，说明较弱的判定结果，拒接假定的参数取值。
如果 P值>0.05，说明结果更倾向于接受假定的参数取值。

比如一枚均质硬币，抛 10 次：

有 8 次正面的概率为 (108)+(109)+(1010) > 5%
有 9 次正面的概率为 (109)+(1010) < 5%

1. 实际应用

在比如这样一个问题，某公司声称研制了一种系统，对此地的犯罪事件进行预测成功的概率为 70%，已知某天的 14 起案件预测对了 13 件，那么统计学意义上，公司是否谎报了自己的数据呢？

(14 13) \cdot 0.7 13 \cdot 0.3 1 + (14 14) \cdot 0.7 14 = 0.04069 + 0.00678 < 5 %

posted on 2016-08-26 14:52 未雨愁眸阅读(471) 评论(0) 收藏举报

刷新页面返回顶部