代码改变世界

统计学和德国坦克

2006-08-31 07:30  atempcode  阅读(1553)  评论(3编辑  收藏  举报
http://www.guardian.co.uk/g2/story/0,,1824525,00.html

当一般的情报渠道不能得到敌人的坦克数量时,一个小小的方程式就可以做到。

1941,1942年间,盟军的美国和英国造的坦克作战能力超过了德国的Panzer坦克。但是盟军还是很担心德国的新型坦克Mark IV和Mark V。而且盟军根本就不知道德国人一年能造出多少坦克来。缺少这个信息,盟军对西线作战的胜利没有把握。
一开始,情报部门观察德国坦克制造厂,甚至专门在战场上数德国人的坦克。这些方法收获甚微。后来情报部门找来了统计学专家,想看一看他们有没有什么好的办法。
统计学家们有一个关键信息:缴获的Mark V 坦克上的序列号。统计学家们相信根据德国人的天性,他们会根据生产的顺序给这些坦克编号。这些信息就足够让这些专家们就行精确的估计了。
原理是这样的:德国坦克编号是1,2,3,。。。N。这里的N就是坦克的总生产数量。假设盟军缴获了5台坦克,他们的编号分别是20, 31, 43, 78 和 92。这里样本总数S是5,最大序列号M是92。他们在其它一些系列上进行了测试和演算,得出了一个公式:制造总量=(M-1)(S+1)/S。在上面的例子中,(92-1)(5+1)/5 = 109.2。所以总产量在109左右。
运用这个公式,统计学家门得出结论:在1940年6月到1942年9月,德国每个月制造出246台坦克。情报部门得出的数据要高得多,1400台。战争结束后,盟军拿到了制造厂的生产报表,数据显示这三年德国每月生产245台坦克。
统计学家帮助盟军赢得了战争。