面对满足正态分布的事情,我们如何增加成功概率
一、正态分布视角下的「优异问题」
这篇文章咱们把“正态分布”这个知识给发挥一下,我们知道世界上很多事物都符合正态分布,包括人的身高和智商、产品的质量等等。下面这张图描写了一个均值是 1,标准差是 0.1,总数量也是 1 的正态分布曲线,
咱们以智商为例。图中横坐标代表智商的高低,越往曲线的右侧智商就越高;纵坐标代表人数,越往上代表人数越多。曲线下方的阴影区域面积就是总人数。
请注意这三个变量的大小都是可变的,针对具体的问题可以按比例放大或者缩小。比如智商的均值是 100 分,标准差是 15 分,那么图中横坐标的 1.0 对应的就是智商 100;1.2 对应的就是两个标准差之外,也就是智商 130;如果你要研究的总人数是 100 万人,那么阴影区的总面积就是 100 万。
现在我们最感兴趣的,是我用红色的框标记出来的那个区域,称为“优异区”。它出现在分布曲线右侧的大约两到三个标准差之外的尾巴上,代表统计中最出类拔萃的样本。
- 如果你研究的是人群的智商,这个区域就代表智商最高的人群,他们的智商都在 140 以上。
- 如果你研究的是一个诗人的作品,这个区域就代表他最高水平的产出。
- 如果你研究的是一个国家的足球运动员,这个区域就代表最顶级的足球运动员
我们的问题是,如何增加那个区域的面积?
也就是说,
- 如果你是个老师,怎样让你的学生中多出几个聪明人呢?
- 如果你是个诗人,怎样才能多写几首好诗呢?
- 如果你是个企业家或者投资者,怎样才能多抓住几个出类拔萃的好项目呢?
怎样增加优异数,这是有进取心的人最关心的问题,而光凭直觉说我要“努力!奋斗!”、或者只是凭直觉说”我要多多尝试“那种思维太落后了。正态分布这个数学模型,可以帮你理清思路。
根据正态分布,你可以影响的其实就是三个变量:
- 总量
- 标准差
- 均值
二、提高总量
增加总量是个直观的办法:如果我们把总数增加一倍,优异区的数量自然也会增加一倍。
- 比如作为一个作家,我写的文章之中可能有的你感兴趣有的你不感兴趣,但是我什么都写。只要我写的东西足够多,总会有你感兴趣的内容。
- 学生多的老师自然更容易遇到好学生
- 读书多的人更容易有真知灼见。
- 你投资的项目足够多,总有遇到好的项目
- 你投入创造的资源越多,总有可能产生颠覆式创新
多年以前,中国制造的水平不像现在这么高,经常有质量问题。当时我记得有人提出一个很有意思的问题,说中国航天的水平非常过硬,发射卫星很少失败,可是中国制造的汽车质量却不行,而对比之下,日本制造的汽车质量很好,可是日本航天的水平却不如中国航天,经常因为技术问题导致发射任务失败,这是为啥呢?
答案就在这个优异区之中。中国搞航天是举全国之力干这一件事儿,可以把每一种零件都让不同的厂家生产很多个,然后从中挑选最好的一个。这就是以总量取胜。总量多了,总能挑出几个好的来。
用提升总量来获得优异数,这是一个用战略的勤奋弥补能力的不足的方法……但是生产汽车可不能这么干,得个保个质量都过硬才行。
提高总量,是个低效率的笨办法。
三、提升均值
提升均值才是解决问题的根本办法。想要理解这一点,请你思考这么一个问题:为啥中国有十四亿人,都找不出十一个足球天才来呢?为啥冰岛只有三十多万人,足球水平却比中国队强那么多呢?
有个写数学博客的外国友人,替中国足球操心,说答案就在正态分布曲线的这个形状之中。进入优异区之后,曲线下降的速度非常、非常之快。比如请看咱们开头说的这个分布曲线在尾部的情况,
从4个标准差到4.5 个标准差,再到 5 个标准差,曲线纵坐标的落差是以数量级的方式下降的。这也就是说,越是天才就越罕见,而且罕见的程度急剧下降。哪怕你有十四亿人口,真到了代表天才的尾部区域,也没几个人。如果天才总共就没几个人,你就算把人口再增加一倍,也多不了几个人。
真正有效增加天才的办法,是提高均值!
我们看看,如果把全中国人民踢足球的平均水平提高 5%,标准差和人口总量都不变,是个什么情形,
这相当于你把钟形曲线往右侧挪动了一点。而这一点,体现在优异区上,就是巨大的差异!咱们把优异区放大了再看,
4.5个标准差之外,面积会有几十倍的差距。
均值对优异区的效果比总量的效果要厉害得多!
冰岛人口是比我们少得多,可是冰岛人踢足球的平均水平可比我们高了远远不止 5%。所以冰岛的球星数量比我们多,这难道不是应该的吗?
这个数学博主还举了个特别有意思的例子。单论成年男子的总数,印度有 6.5 亿,而挪威只有250 万;而印度成年男子的平均身高是165 厘米,挪威则是 180 厘米。那请问,身高 1 米 95 以上的成年男子,是印度人多还是挪威人多呢?
下面这张正态分布曲线尾部的图告诉你答案,
1米 95 以上的挪威人数是印度人数的一百倍。总人口多没啥用。
优异区曲线下降速度实在太快了,你必须用提升均值的方法把曲线往右边挪动,才能得到更大的优异区。
如果你水平就是不行,产量高是没用的。据说乾隆皇帝弘历一生写了四万首诗,可是现在流传开来的一首都没有。中国有句话叫“勤能补拙”,我理解如果你的勤奋是用于提高均值,那可以;但如果你的勤奋都用在了低水平的高产出上,那勤补不了拙,据说是爱因斯坦的一句名言是这么说的:
“所谓精神病,就是翻来覆去做同一件事儿,却期待能有不同的结果。”
四、大标准差
抬高尾部曲线的第三个办法是加大你这个分布的标准差。我们把标准差提高 10%,从 0.1 变成 0.11,就成了下面这个情形,
中间普通区的人数变少了一点,而优异区的人数明显增加了,
对个人来说,扩大标准差意味着你要去尝试一些更极端的事情。比如一个人的工作能力一般,在一个旱涝保收的公司干着,赚钱不多但是很稳定。如果他水平不变又想获得更高的收入,那么冒险加入一家创业公司,是一个办法。当然这么做的缺点是一旦创业不成就会落入曲线左边的尾巴,进入失败区。
对一群人来说,标准差大意味着这群人的水平参差不齐,有的特别高有的特别低。这里有个著名的学术典故。2005年,哈佛大学校长劳伦斯·萨默斯(Lawrence Summers),就为什么女科学家的人数比男性科学家少这个问题,发表了一个私人的看法。萨默斯说这并不是因为女性的平均智商比男性低,而是因为女性智商分布的标准差比男性小。
他说的恰恰就是我们这里讲的这个道理。男性的标准差大,所以在优异区有更多男性。而这并不是说男性作为一个整体优于女性,因为在曲线另一侧的尾巴,也是男性多。男性中特别笨的人,也比女性多。
这纯粹是一个数学性质,但是很多人认为萨默斯这番言论是性别歧视,结果萨默斯就因为这段话而被迫从哈佛校长的位置上辞职了!
五、总结
如果一个系统符合正态分布,要优化这个系统,你要做的不是增加系统的总量,而是应该专注在改进这个系统的内部结构上。
但是要注意的是,我们这篇文章假设人的能力都是正态分布的,这个假设不一定在任何情况都成立。我们的模型能解释为什么中国人多可是中国男足的水平不行,但是解释不了为什么中国没有那么多举世闻名的数学家,要知道中国人的平均数学水平可是很高的。
我猜测到了特别高的水平,人的能力其实是幂律分布的:那些能力强的人会有更大的机会和意愿去进一步提升自己的能力,这里面有个马太效应。要这么说的话,什么“高考加一门足球”这样的办法其实根本提升不了国家队的水平。
但是那只是技术细节。我们今天的结论其实对长尾的幂律分布大体上也是成立的。总结来说,要想增加优异区中的数量,
- 上策,是提升均值。这个方法对优异区的提升非常快,而且没有风险。
- 中策,是扩大标准差。这意味着你要冒险去做一些极端的事情。
- 下策,是增加总量。这是一个笨办法,效果很差。
只要想想有多少人还在问“为什么十四亿中国人都找不到十一个会踢球的”,就知道并非所有人都理解今天说的道理。
以数量取胜非常符合人的直觉。有些年轻人以上大学之前就通读了二十四史为荣,有些家长对孩子的期待是上小学之前认识几千个汉字,有些人四处积累“人脉”。他们犯了和爱新觉罗·弘历一样的错误,以为一只猴子只要不停地打字,就终有一日能打出莎士比亚名句来,他们大大低估了正态分布曲线尾部下降的速度。
高手贵精而不贵多。如果你的输出很多可是你的水平还是以前那样,你从未探索新领域,你缺的不是运气。
……但是,当你的均值已经高到无法再高,当你把能冒的险都冒了以后,数量,就是你唯一可以掌控的东西。巴拉巴西在《成功公式》这本书中提出的最后一个定律,恰恰就是要放量。一个人的科研水平二十多岁的时候就已经到顶了,成功科学家和一般科学家的最大区别是成功科学家一辈子都特别勤奋。
水平够了才配得上比谁敢冒险。水平够了又敢冒险,那就只能比谁勤奋、谁家人多了。