2012年7月4日,欧洲核子研究组织(CERN, the European Organization for Nuclear Research)的物理学家们宣布发现在欧洲大型强子对撞机中一种疑似希格斯玻色子(Higgs Boson)。
[抄自wikipedia]:希格斯玻色子是粒子物理學的标准模型所预言的一种基本粒子。标准模型预言了62种基本粒子,希格斯玻色子是最后一种有待被实验证实的粒子。在希格斯玻色子是以物理学者彼得·希格斯命名。由于它对于基本粒子的基础性质扮演极为重要的角色,因此在大众传媒中又被称为「上帝粒子」。
近50年来,物理学家们一直在追寻希格斯玻色子,因为它的发现将使粒子物理的标准模型得到完善。下面的小片子通俗地讲了一下什么是希格斯玻色子。
作为只有高中物理水平的民科,我也能从物理学家们在宣布这发现时的激动(看下面视频)中感到这发现的重大。
除了表达对科学家的敬仰外,我也对其中提到的 5σ 很感兴趣。既然祖师爷John Tukey 说过
The best thing about being a statistician is that you get to play in everyone’s backyard,
我倍受鼓励的来看看这 5σ 到底是怎么回事。视频中的点睛之笔:
We have observed a new boson with a mass of 125.3 +- 0.6 GeV at 4.9 σ significance.
念玩后大家鼓掌拥抱,热泪盈眶。一番周折后,我才终于找到了CERN的 原版视频(将近两小时,值得看看)。
开始时只是想搞清楚这 5σ 怎么回事(35:10,第84页),没想到听到一堆统计词汇“multivariate analysis technique”,“p-value”,”sensitivity”, 等等劈头盖脸的飞来。最给力的是 Rolf Heuer 讲了一些用Boosted decision tree来提高分类器准确性的过程(18:20,第33页)。不出所料,研究中用到了很前沿的数据分析方法。老祖师果然没错。看来欲知其中细节,得看数据分析啊!
比较遗憾的是我比较看不懂的是环球科学(科学美国人中文版)的文章 “希格斯粒子现身LHC?”最后对 5σ 的解释:
估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。1-α 为置信度或置信水平,其表明了区间估计的可靠性。显著性水平不是一个固定不变的数字,其越大,则原假设被拒绝的可能性愈大,文章中置信度为5σ(5个标准误差),说明原假设的可信程度达到了99.99997%
好像这是把假设检验和置信区间绞在一起解释了。本来看了视频还我还觉着我这物理外行也看懂了,现在又被解释糊涂了。谁能看懂给解释一下?
推荐对数据分析有兴趣的听一下这神粒子的声音(Listen to the decay of a god particle)。一群粒子物理学家,编曲家,软件工程师,和艺术家用粒子对撞机的数据编成的曲目。另类的数据展示!太强大了。
by 希格斯玻色子与5σ