《多样性红利》(The Difference: How the power of diversity creates better groups, firms, schools, and societies)笔记
一、“多样性”到底好在哪里
“多样性”,英文是“diversity”,这个词现在已经不是新词了,你肯定曾经在各种场合听到过。多样性的意思是说如果你要选一组什么东西的话,最好不要全选一样的或者类似的,最好要参差多态,什么样的都来点儿。
据我观察,在中国,“多样性”主要出现在“生物多样性”、“文化多样性”这些领域,有一点保护濒危物种的意思。可能是出于审美,也可能是防备将来万一哪个物种会有用,反正是希望世界上的东西最好是五花八门什么都有。
但是在美国,“多样性”现在越来越具有政治正确的含义,主要用来说人员构成的多样性。高科技公司的雇员,总统的内阁,法庭的陪审团,大学录取的新生,如果清一色都是白人男性,那就犯了大忌。哪怕你什么坏事都没做,单单这个人员构成都会受到舆论谴责,不管干什么事儿都别想理直气壮,人们自然就会认为你有偏见。一个团队里最好有黑人,有女性,有老人,有来自低收入家庭的人,你才能踏踏实实地立足。
比如说,我们经常听到中国的女高中生,因为学业优异,被美国多所著名大学录取还给了巨额奖学金的新闻,那你是否有一个疑问:为什么总是“女”高中生呢?为什么非得是哈佛“女”孩呢?难道说美国大学害怕中国的男生去跟美国学生竞争吗?其实这就是“多样性”。这里面有一条潜规则。“中国女生”,具有“少数族裔”和“女性”两个多样性标签,所以每录取一名中国女生,学校就可以录取两名白人男生了。
那你可能会说,多样性是一个虚伪的要求。既然人们都知道白男能力强,既然学校内心深处最想录取的就是白男,为什么不搞唯才是举,非得满足这个什么多样性名额比例呢?
我想告诉你的是,包括男性自己在内,所有人都不希望看到一个由男性主导的世界。多样性不仅仅是故作姿态的政治正确,多样性真的有大好处。
这篇文章,我们讨论一本有关“多样性”的最权威的著作,叫《多样性红利》(The Difference: How the power of diversity creates better groups, firms, schools, and societies),作者是密西根大学政治学教授斯科特·佩奇(Scott E. Page)。
佩奇可不是那种只知道夸夸其谈的“政治学家”。他精通数学和经济学,曾经在加州理工学院担任过经济学的助理教授,现在还在复杂性理论的研究圣地 —— 圣达菲研究所 —— 兼职,他专门使用“理工科思维”研究社会问题。
佩奇,算是把“多样性的好处”这个问题给彻底研究明白了。其实你可能听说过这个领域的一些内容,比如说“群体的智慧”。但是佩奇讲的,可不是从一些例子中悟出一个道理、一个寓言典故那种,更不是建立在什么价值观上的意识形态的东西。
佩奇给“多样性的好处”,找到了坚实的数学基础。
佩奇提出,多样性有两个好处:
- 一个是解决问题
- 一个是做预测
一个多样性的团队特别适合解决复杂的问题,和对复杂的事物做出准确预测。
佩奇的理论可以用两个数学公式概括,
- (1)群体能力 = 平均个人能力 + 多样性
- (2)多样性 > 能力
这可不是两个观念上的公式,它们背后有严格的数学推导。其实这些数学也不难,如果你知道怎么计算统计学上的“方差”的话,你完全可以看懂佩奇的严格理论,但是这本书里没有做详细的推导。
用最简单的语言说,多样性的好处就是,三个臭皮匠,好过一个诸葛亮。
比如你可能听说过这么一个经典的实验。课堂上,老师带来一个透明的大罐子,里面装了很多糖豆,老师让学生们估计这里面糖豆的总数是多少。有的人说的多,有的人说的少,但是你把所有人估计的数字取个平均值,发现结果非常接近糖豆的真实数目。
这本质上是个预测问题,它的结果体现了“群体的智慧”。从数学上讲,这个实验是说,群体预测结果的“方差”,总是小于群体中每个人的预测的方差的平均值。佩奇曾经在 TTC 讲过一个有关多样性思维的课程,佩奇在这个课程里用一个数学公式说明了这一点,
这个公式也就是
群体预测的方差 = 群体中个人预测的方差的平均值 - 群体多样性。
再翻译成人话,
鉴于方差越小能力就越大,这其实就是前面我们说的公式:
(1):群体能力 = 平均个人能力 + 多样性
三个臭皮匠的个人能力都不高,但是因为他们有多样性,他们表现出的群体能力,超出了他们三个人的平均能力,甚至可能比一个诸葛亮都高。多样性,是一个红利。
生活中有很多这样的例子。我们在《用足球验证有效市场假说》这篇文章里介绍过,群体的智慧,在赌球交易市场里,那是非常非常的有效。
现在各个领域都在追求群体的智慧。
- 很多公司搞开放的办公区域,就是希望不同部门的员工能够经常碰撞在一起,时不时来个头脑风暴。
- 很多研究所和大学现在也在探索让不同学科的研究者在一个楼里办公,搞搞“想法的连接”,发展“交叉学科”。
关于第二个公式,多样性优于能力,佩奇在《多样性红利》这本书里举了很多例子。1999年,曾经有人组织了全球的五万名国际象棋棋手,通过互联网,跟卡斯帕罗夫下了一场比赛。双方每走一步都可以考虑48小时。在群体这一方,五万人是在网上论坛讨论每步棋该怎么走,集思广益,然后投票表决。
最后结果还是卡斯帕罗夫赢了,但是请注意,这局棋一共走了62步。对国际象棋来说,能走这么多步,说明这是一场势均力敌的比赛。五万个普通棋手,在堂堂的卡斯帕罗夫面前,并没有变成不堪一击的乌合之众。
可是如果群体的智慧这么有效,那我们为什么不把什么事情都交给群体,让市场和民主来决定呢?比如说足球吧,中国队每次输了球,论坛上都有很多“懂球帝”一致认为主教练的排兵布阵有问题,那既然如此,中国足协何不干脆把决定出场名单的权力交给广大球迷呢?
这种事儿还真有人干过。2006年,美国棒球小联盟的绍姆堡飞人队,就曾经让球迷投票决定球员的出场顺序和战术……结果实验惨遭失败。首先球迷并不真的了解每个球员,而且跟卡斯帕罗夫面对的那五万个对手不同的是,绝大多数球迷,其实并不真懂球。
所以群体的智慧并不是总好使。这就体现出佩奇这一套数学理论的好处了,严格地说,要产生多样性红利,你的问题必须满足四个条件。
- 第一,这个问题必须得足够“难”,要难到没有一个人自己能够单独解决的程度。如果是一个人就能解决的事儿,强行搞多样性就是浪费人力。
- 第二,群体中的每个人,都必须有一定的能力。也就是说每个人都得够格才行,国际象棋棋手可以,但球迷不行。
- 第三,群体中每个人都有跟别人不一样的视角和解决问题的方法。那也就是说每个人都要有他独特的价值。
- 第四,群体的规模必须足够大。
怎么理解这四点呢?佩奇提出了一个特别漂亮的模型,我希望你能记住这个模型,最好还经常回想。
假设我们要探索一个很大的区域,这个区域里有很多山峰,而我们想快速找到最高的那座山峰,所以我们找了很多探险家来共同探索这片区域。对应到前面那四个条件,要求就是这样的,
- 第一,最高的山峰很不好找。如果一个人一眼就能看出来哪里最高,用群体就没有意义。现实是我们没有地图,每个探险家只能看见自己附近的一小块区域。
- 第二,每个探险家都能迅速找到自己附近的“局部最高点”。这样他才算的上是合格的探险家,否则就是个来旅游的。
- 第三,你应该把全体探险家随机地分配到各个区域去,不要让他们扎堆。如果有个探险家非得跟别人结伴而行,那他就是多余的了。
- 第四,探险家的人数得足够多。
你可以把任何一个复杂问题都想象成寻找区域内的最高峰,在不同的地方探索就相当于用不同的视角和方法寻找各自的“局部最高点”,而最终解决问题,就是发现了“全局最高点”。
我认为其中最关键的是第三个条件,每个人的视角和方法不一样。这才是多样性红利的本质:多样性,是解决问题思路的多样性,是观点多样性。
这个道理也适用于第一个公式。就拿前面那个猜糖豆的实验来说,必须是每个人都独立思考,群体的智慧才有效。如果大家都人云亦云互相模仿,那就是一群乌合之众。
多样性红利首先是一个思维模式。只要你明白多样性的好处,善于从不同的视角、使用不同的方法解决问题,那你一个人就可以拥有“群体的智慧”。佩奇在书中总结了一套“多样性认知工具箱”,到底什么叫“视角”,都有哪些“方法”,咱们后面继续讨论。
二、难题的“视角”
前面我们说了,多样性的红利,只有用在难题上才有意义。佩奇在书中使用了很多数学题作为例子,这些题有点像是“奥数”,它们并不需要用到什么微积分之类高等数学的知识,但是需要你动脑。
佩奇总结了一套“多样性认知工具箱”,其中包括“视角”、“启发式”、“解释”和“预测模型”四种工具,我们这章先说“视角”。
什么是视角呢?佩奇给的精确定义是,“视角是从现实到内部语言的映射”。这个说法非常晦涩,咱们还是换个更透彻的说法。
以我之见,所谓视角,就是你“怎么看”这个东西,你把这个东西“看成什么”。
我举个例子。比如这里有一大堆鱼,其中各种各样什么样的鱼都有,请问你怎么看这些鱼。
- 一个外行看这些鱼,可能会看到有的鱼大有的鱼小,或者看到有的是死的有的是活的。
- 渔民看这些鱼,可能考虑它们的巡游地点,思考这些鱼是怎么捕捞来的。
- 市场上卖鱼的人看,他想的是哪个鱼贵哪个鱼便宜。
- 而在你看来,可能想的就是哪个好吃哪个不好吃。
这些不同的看“法”,就是视角。
我们以前讲过佛学里的“色即是空”,我们知道每个人看世界都带着一副有色眼镜,有色眼镜就是视角。我们还讲过“丑小鸭定理”,我们知道每个视角都是主观的。但是我们以前都是从“哲学的视角”说视角,今天我们要从“解题的视角”说视角。
佩奇有三个洞见。
- 佩奇的第一个洞见是,视角的选择,对解题的难易,关系重大。
比如我们在高中数学课学过“直角坐标(也叫笛卡尔坐标)”和“极坐标”,这两种坐标系就是两个视角。这两个坐标系完全可以一一对应地转化,但是,选对了坐标系,你解题就会简单得多。
- 要描写一个正方形的顶点,直角坐标非常方便
- 要描写一段圆弧,那就最适合用极坐标。
生活中也是这样。
- 要描写一个复杂的地形,你最好画张图
- 要叙述一个复杂的道理,画图有时候就不如文字方便
从哲学上说所有视角都是平等的,但是从解题上说,视角跟视角可太不一样了。
- 佩奇的第二个洞见是,要想有利于解题,你这个视角最好自带某种结构。
比如说“能按照数字排序”,就是一种结构。在门捷列夫发明元素周期表之前,很多人都尝试过把各种元素分类。你可以考虑按照元素的某一种化学性质分类、按照颜色分类、甚至按照产地分类,这些都有道理,但是没有科学结构。门捷列夫考虑到“原子量”,确切地说是质子的个数,这个视角,它就自带一个结构:它允许你把元素按照质子数排序。
有了结构,你看东西就不再是杂乱无章的一堆,你就有了章法。数学上的坐标系,就是一个结构化的视角。
现在咱们先举个例子,用一下佩奇的这两个洞见。
一个冰淇淋公司想要研发一种新口味,他们要在冰淇淋水里面融入一种软糖。这个软糖有四种不同的尺寸,其实成分都一样,他们不知道该用哪种,也不知道该加多少。于是公司组织了一系列的实验,而且提出了一个结构化的视角。他们建立了一张表格,横坐标代表用软糖的数量,纵坐标代表用的是哪个尺寸的软糖,
比如图中(2,3)这一点,就代表“用两打直径是三厘米的软糖”这个配方。这样所有配方都排列在了这张表格上。公司选取了几个点进行测试,发现(2,3)这个配方似乎不错。
这显然是个笨办法。我们刚才都说了,每种尺寸的软糖的成分其实都是一样的,最后都要融合在冰淇淋里面,那你直接算个总数不就行了?所以根据佩奇的描述,公司请来一位叫内莉的顾问,内莉提供了一个不同的视角。
内莉建议把不同的配方按照每份冰淇淋的卡路里含量来排列。既然公司已经发现(2,3)是个不错的配方,内莉就测试了(2,3)附近的六种配方。
用内莉的卡路里视角,这六个配方是:
其中的 252 卡路里就是(2,3)。内莉在附近探索,发现 255 卡路里的味道更好,并且最终确定这个是最佳配方。
按照内莉的视角,我们看到她从252找到255的过程非常自然,就是在好东西的附近找找看有没有更好的东西,对吧?可是你如果使用公司之前的坐标系视角,内莉这个发现可就大大出乎你的预料了。
255 对应的配方坐标是(4,1),它距离(2,3)很远!
公司肯定会对内莉说,“你怎么就能想到考察那里呢?简直是跳跃式的思维!”,殊不知在内莉的视角看来,那是一个最邻近的考虑。
这个公司听起来有点傻,但是这个道理非常清楚。
- 第一,视角选对了,问题就容易解决。
- 第二,视角的内在结构非常重要。
现在咱们说一个高级的例子,看看视角的真正威力。有个游戏是诺贝尔经济学奖得主、计算机科学家赫伯特·西蒙(Herbert Simon)发明的,叫“抢15”。玩法是在桌子上摆上从1到9九张牌,两人轮流取牌,谁先拿到相加等于15的三张牌就获胜。
比如如果对方手里已经有2和9,而你有1和7,现在该你走,你一定要拿4,否则下一把对方拿4就赢了。你可以尝试玩一下这个游戏,既要顾着自己又要盯着对方,相当复杂。
可是如果你换个视角,游戏就会变得非常简单!你只要把这九个数字摆成一个九宫图,如下图所示,
这个图的特点是任意一条横、竖和对角线上三个数字相加都是15。数学上管这种图叫“幻方”。抢15的游戏就相当于在幻方上画圈占地,而你要做的,就是设法让自己占的三个格子连成直线,同时避免让对方连成。
而这不就是小孩玩的“井字棋”游戏吗
同样是一堆数字,你的视角要是计算加减法,那就很麻烦;可是你换个视角改成连线题,就变得一目了然。那是不是对所有的难题,都能找到这样让人茅塞顿开的视角呢?
- 这就是佩奇说的第三个洞见:对任何一个问题,都存在一个能让答案一目了然、脱颖而出的视角。
这句话可不是随便说的,佩奇为此专门提出和证明了一个数学定理,叫“学者存在性定理(Savant Existance Theroem)”。
这句话说着容易,但是真要找到那个视角,可是非常困难。事实上,如果你仔细考虑佩奇对“视角”的定义,凡是能把一堆东西跟你随意定义的某个内部语言对应起来的关系,都是视角,那么有些视角很可能无法用直觉获得,以至于对解题没什么帮助。
比如书中有个例子是这样的。佩奇从他的家乡随便找了14个房子,它们的面积有大有小,价格有低有高。那到底是什么因素,决定了房子的价格呢?
面积似乎是个不错的视角。我们把这些房子按照面积从小到大排列,并且从1到14编号。在下面的图中,横坐标是房子的面积编号,纵坐标是价格,
总的趋势,的确是面积越大的房子价格越高。但是从严格的数学意义上讲,佩奇说,面积不是一个完美的视角。比如2号房子,它的面积明明比3号房子小,但是价格却更贵;5号房子的面积算是不错了,但是价格却是所有房子里最低的。
佩奇说,面积这个视角的问题在于,图中除了14号房子这个全局最高峰之外,还有好几个“局部高峰”。站在局部,你还以为那些房子价格最高,而事实上根本不是这样。完美的视角应该让这张图中只有一个高峰,在边上也好在中间也行,总之你看到的高峰就是全局高峰,就好像富士山一样,答案一目了然才好。
把房子按照房价编号为1到14,然后我们只要找到这么一种给房子排序的方式,让14左边的数字都是一直增加,14右边的数字都是一直减少,比如排成 1、4、5、6、9、11、14、13、12、10、8、7、3、2,就是一个满足富士山条件的“单峰景观”。如果你把这个排列当做一个视角,那这就是一个解决问题的完美视角。
可问题是,这个视角到底代表啥呢?是地段吗?是房子的新旧程度吗?很可能都不是。所以以我之见,完美视角虽然必定存在,但是未必对咱们解题有用,因为你事先想不到。
但是佩奇说,“学者存在定理”给了我们希望。一道难题摆在面前,可能当前谁都不知道怎么解决,但是你要相信,总有一个视角,会让答案看上去那么简单,能够脱颖而出。
这就好像以前的人认为光非常神秘,而牛顿一旦有了“光是不同颜色的混合”这个视角,光就不再神秘了。以前的人觉得天体运行非常复杂,而牛顿一旦有了引力这个视角,他就能精准计算行星轨道。
视角,决定了问题的难度。
你是否曾经尝试过使用不同的视角去攻克一个难题呢?那是美妙的体验
三、套路的“启发”
这章咱们继续讲斯科特·佩奇的《多样性红利》这本书里的“多样性认知工具箱”。上一章我们说了“视角”,这一章的主题是“启发式”。
“启发式”的英文是“heuristic”,这个词你可能听着有点别扭,我甚至怀疑咱们中国文化里到底有没有这个词。但是如果你去了解一点认知心理学,启发式简直到处都是。
什么叫“启发式”呢?从解题的角度,佩奇给的定义是“启发式是这么一个规则:在某个视角里,使用这个规则能够得到一个解,那么你受此启发,也许可以把这个规则用在别的问题上,得到别的解。”
我把这段话翻译成普通话,启发式就是思维的套路。比如我最近陪妻子看了一点《延禧攻略》,其中有个剧情是皇后想除掉纯妃,但是她自己不动手,而是给魏璎珞提供机会……咱们中国人一看就明白,这叫“借刀杀人”。套路就如同武术里的招式和下棋的棋谱,是你一旦掌握了就可以不假思索地使出来的东西。
当然“三十六计”什么的有点上不了台面,heuristic 有更高端和更基本的含义。查理·芒格总结了很多所谓“心智模型(mental models)”,就是高端的启发式。比如我们最近讲过做决策的一个“10-10-10”方法,就是一种心智模型。熟练掌握这些模型,你在面临各种决策的时候就不用现场手忙脚乱了,而且你知道哪些地方有可能是你的思维误区。
对认知心理学家来说,启发式有更基本的含义,大约可以称为“思维快捷方式”。丹尼尔·卡尼曼说过一个例子是这样的:请问,在英文中,是以字母 k 打头的单词多呢,还是以字母 k 作为第三个字母的单词多呢?你的第一反应,肯定是以 k 打头的单词多,这是因为你马上就能想到好几个以 k 打头的单词,可是你很难想到一个第三个字母是 k 的单词。你这个思维,就是“易得性启发式(availability heuristic)”,你觉得你容易想到的东西比不容易想到的东西多。
我们的思考离不开这些快捷方式,以至于你都意识不到自己在使用快捷方式,它们属于卡尼曼说的“系统1”。但是这些快捷有可能会让我们判断失误,比如刚才那个例子,事实是第三个字母是 k 的单词更多。所以“易得性启发式”也叫“易得性偏误(availability bias)”,我们以前讲过,纳西姆·塔勒布就曾经批评史蒂芬·平克在《人性中的善良天使》中犯了易得性偏误。
但不论如何,没有启发式是不行的,你不可能面对什么事情都从头推演。作为社会栋梁,你更得多掌握一些高级的启发式。
回到佩奇这本书。佩奇讲的是专门用于解决难题的启发式。在佩奇的这个系统中,“启发式”和“视角”是两码事。前面我们讲了,所谓视角,是你怎么看这个东西,相当于建立一个坐标系。那么启发式,则是有了坐标系之后,你怎么在这个坐标系里“走”。
比如我们上次说的内莉做冰淇淋实验的例子。内莉想到去按照卡路里含量把不同的配方排序,这一步就是建立了一个视角。
那么下一步,在已知252卡路里的这个配方味道不错的情况下,想到去考察它在这个视角下临近的几个配方,这就是启发式。
- 这也是佩奇说的四个解题启发式中的第一个,叫“拓扑启发式(Topological Heuristics)”。
不要被“拓扑”这个充满数学味道的词所吓住!其实所谓拓扑启发式,就是看看四周临近的地方。比如你读到一本书觉得有意思,你就想看看这位作者还有没有别的书,这就是在使用拓扑启发式。
拓扑启发式的成败跟视角关系很大。视角就好比是坐标系,自带一个结构,而拓扑启发式则是沿着这个结构走。
拿刚才选书的这个例子来说,考虑作者,就是一个不错的视角,你的拓扑启发式是看看同一作者的其他作品。而如果你的视角是“书的封面颜色”,看到一本蓝色封面的书觉得不错,于是专门找蓝色封面的书读,那就大错特错了。
拓扑启发式是只要是临近的地方都可以考虑,没有特定的方向。更高级的做法是下面一个,
- 佩奇说的第二个启发式,叫做“梯度启发式(Gradient Heuristics)”。
梯度启发式也考察邻近的地点,但是它有一个明确的方向。
最简单的例子,就是你做汤,尝一尝感觉有点淡了,你认为这不是最优解。那怎么探索最优解呢?既然现在汤淡,你想让它变咸一点儿,你想要的就有一个明确的上升的量,在数学上,这就叫“梯度”。那么显然你应该加盐,而不是加水。你的探索有一个明确的方向。
咱们还是用探险者探索一片区域的最高峰来类比。作为一个探险者,如果你现在的位置不是哪个山头的山顶的话,那么梯度启发式告诉你,你应该往高的地方走。你看看四周,哪个方向越走越高,你就往哪个方向走。
这种走法方向明确,但是有一个重大缺陷,它限制了搜索的“多样性”,
图中有左右两个峰,而你身处图中的 A 点,在左边小峰的半山腰。你只能看到自己附近很小的区域的地形。为了找到高峰,梯度启发式会告诉你往左走,因为现在往左是越走越高,这么走的结果是你将会发现左边的高峰。可是这样一来,你就只找到一个局部的高峰。右边那个更大的高峰,被你错过了。
这就好像一个一门心思就想多挣钱的人,看到哪个公司给的工资高就去了,殊不知如果选择右边这条路,虽然一开始的收入是下降的,但却可能达到一个高得多的高度。怎么才能避免犯这样的错误呢?
- 这就是佩奇说的第三个启发式,叫“允许犯错启发式(Error - Allowing Heuristics)”。
所谓允许犯错,就是你可以搞一些“任意的震动”。
那么一个身处刚才的 A 点的探险者,他可以先不着急选定一个方向一门心思前进,他先四下看看再说。这个看看可以是完全随机的,也许就会有意外的惊喜,也许就能找到右边那个更高的峰。
可是一直这么随机地看也不行,你总要有所选择才好。这个问题,就和我们曾经讲过的《指导生活的算法》一书中说过的“探索与收获的取舍问题(Explore/Exploit Tradeoff)”是一样的。这个思想就是年轻的时候要多探索,年龄到了一定程度就要选定一个方向深耕。
佩奇使用了类似的思想,但是他给的例子叫“退火算法”。这个算法的大概意思是把行动分解成两个函数之和,一个代表随机的探索,一个代表用“梯度启发式”选定方向前进。所谓“退火”,就是你给系统设定一个“温度”:一开始温度比较热,那就多来一点随机探索,随着时间流逝温度越来越凉了,那就减少探索。
一开始你的错误多但是机会也多,后来你就没有随意犯错的权利了。其实我们开“头脑风暴”会也是这样,一上来大家你一言我一语可以随便出主意,但是最后总要选定一个方向集中思考。
- 佩奇说的第四个启发式,叫“种群启发式(Population Heuristics)”。
种群启发式是用模拟生物进化的方法找到最优解。
你可能听说过“进化算法”这种东西,它的思想是这样的。比如说你要寻找一个什么东西的最佳配方。如果这东西的配料只有一两种,你固然可以使用前面的那些启发式,从一个配方开始,在临近的区域慢慢试,淡了就加点盐,咸了就加点水。可是如果这个东西的配料特别多,你怎么办呢?
你要把配方给数字编码化,每一组数字代表一个配方的“DNA”。然后你先随机地生成一些配方,从中选择几个比较好的,让它们互相“交配”,“生育”出下一代配方。比如说,A 配方和 B 配方的性能都不错,那么你可以取 A 配方的前半段,和 B 配方的后半段,生成一个 C 配方,那么 C 就是 A 和 B 的孩子。
你让第一代优秀的配方这样交配,当然每次选择 DNA 的哪一段是可以随机调整的,就生成了第二代。为了模仿进化,你还可以在每一代搞些随机的“基因突变”。对第二代配方,再从中选取优秀的,赋予它们生育权,再得到第三代配方……以此类推,你终将获得一个特别优秀的配方。
据我所知,进化算法在设计方面有很多实际应用,不过我觉得一般人恐怕用不上这么高级的方法。但不论如何,让好东西自己冒出来,这个思想值得你拥有。
佩奇只讲了四个启发式,而真正解题能用的套路太多太多了。而且最后还有一点需要你了解,并不存在一个万能的套路,用在所有问题上都好使,这个理论甚至还是一个数学定理,叫“没有免费午餐定理(No Free Lunch Theorem)”。
所以你要做的就是多掌握几个套路,多转换几个视角,解题,不正是如此吗?
四、歧视的解药
佩奇总结了一套“多样性认知工具箱”,前面2章我们讲了其中的“视角”和“启发式”这两个工具,这章咱们一次讲完剩下的两个,“解读”和“预测模型”。
我在微博看到被人层层转发的一个小文章,其中又是民国杜月笙的传奇又是当代的典故,得出一个结论叫“人要守规矩”,其实整个道理都不通,我看没什么逻辑。而我注意到,最早把这篇文章发到微博的那个人,是个已经退役多年的乒乓球运动员。
我就好像听见一个声音对我说,你为什么要读一个乒乓球运动员发的文章?她能有什么思想?可是另一个声音对我说,乒乓球运动员怎么了?也许人家也有真知灼见,可不能歧视啊。
你肯定遇到过同样的矛盾。通常我们管这叫“贴标签”和“歧视”。给人贴标签,你就会有歧视;不贴标签,你就没效率。这章我们要说的,就是换两个高级的说法,这就是“解读”和“预测模型”。
0x1:翻译、解释和解读
我先帮你辨析三个英文单词。
- translate,意思是翻译。
- explain,意思是解释。这两个词的意思你非常了解。那么
- interpret,是什么意思呢?
首先它有翻译的意思。比如你要跟一个美国代表团谈判,需要找个口语翻译,这种口语翻译,就叫做“interpreter”,而不叫“translator”,后者特指文字翻译。
但 interpret 这个词还有解释的意思。比如领导在讲话中说了一句很不寻常的话,这句话是中文白话,不需要翻译,可是你无法领会领导这是在表扬还是批评你,你需要找人给你解释一下,这个就叫 interpret。但这个“解释”,和 explain,似乎又有不同。Explain 更像是解释“为什么会如此”,而 interpret 则是说“这代表什么意思”。
所以我觉得也许应该把 interpret 译为“解读”。它的名词形式,interpretation,是你对一个事物的“定性”。
比如说,中超上海申花队有个球员叫登巴巴,
当你想到登巴巴的时候,你会把他当成“什么”呢?在不懂球的中国人眼中,这是一个黑人。在足协领导眼中,这是一个外援。在球迷和球员眼中,这是一位强力前锋。
登巴巴有各种不同的身份,你把他当成哪个身份,就是你对他的“解读”。那你可能马上会想到,这不就是我们前面说的“视角”吗?以我之见,在佩奇这个体系下,解读和视角的区别仅仅是数学意义上的。
- 佩奇说的视角,是从观察对象到语言的“一对一”的映射
- 佩奇说的解读,则是“多对一”的映射。解读,是对视角的进一步简化。
比如现在有五只狗,它们分为三种不同的颜色(白色、黑色、褐色),同时又分为三种不同的尺寸(大、中、小)。一个完整的视角,是按照颜色和尺寸这两个坐标,给所有这些狗建立一个二维的表格,
而如果你只考虑一个维度,比如“黑色”的狗,那就相当于在这个视角之下进一步把狗分类,这就是一种“解读”。比如看到一只纽芬兰犬,你可以把它定性为“大狗”,也可以把它定性为“黑色的狗”,这两种定性完全是你自己主观的、任意的选择,也就是你的解读。
说白了,解读,就是在一个视角之下,把东西做进一步的分类。
- 如果你的分类方法是选择视角中的一个维度并且忽略其他维度,那就叫“投影解读(projection interpretation)”。
- 而你也可以不管什么维度,任意选择几个东西说它们就是一类,这就叫“聚丛解读(clumping interpretation)”。
这些拗口的概念并没有太多深意。关键问题是,在已经有了视角的概念的情况下,非得再弄一个“解读”,到底有什么用呢?
0x2:足球妈妈
假设你是一个总统候选人……的竞选团队里的一名专家。现在我们能用于做广告的竞选经费有限,需要精确选择,到底应该向哪一类人,精确投放广告。
把人分类的维度实在是太多了,有性别、婚姻状况、年龄、收入、种族、职业、居住地……等等,你可以用所有这些维度弄一个多维的大视角。这个大视角对你没啥用,你想要的,是从中找到一个最值得投放广告的小类别。
比尔·克林顿竞选总统的时候,专家帮他找到一个这样的小类别,叫“足球妈妈”。这个名词来自于那些下班以后接送孩子参加足球训练的妈妈们,但精确的定义是这么一群人:她们是女性,年龄在30到40岁之间,有子女,有工作,有配偶,住在市郊的别墅房里。“足球妈妈”,是专家对这些人的“解读”。
为什么这个类别重要呢?因为当时54%的足球妈妈,还没有决定要投票给谁。她们是你最值得争取的选民。对比之下,像“富有的老年公民”这个类别,投给谁早就想好了,在他们身上做广告就是浪费钱。
这就是把事物分类的好处。选择一个特定的分类,集中力量对付它,你做事才能有效率。
可能专家偶然认识一位足球妈妈,发现她没有什么强烈的政治理念,她只关心自己的小日子,所以她选总统看的是谁当总统能让经济形势好、能增加就业,而这个经济问题跟党派的关系不大,所以她还没有决定投票给谁。专家把这个特例推广到一般情况,经过统计分析发现果然有这么一个趋势,所以这就是一个很好的认知。
当然你可能发现你推广得有点太过了。也许专家一开始的结论是所有已婚有孩子的女性都没决定,那你就要再调整自己的分类,让它再变得特殊一点。
能推广,能调整,这是高级的认知。
0x3:预测模型
给定一个大视角,你可以任意选择分类解读、而一个有意义的解读,必须得能做出经得起检验的预测才行。
专家列举了足球妈妈这个分类,他就必须得证明这个分类里的选民有“尚未决定投票给谁”这么一个特点。这就是预测模型。
预测模型 = 分类解读 + 预测
现在我们说一个书中很有意思的例子,来说明一下预测模型的特性。
好莱坞的电影公司总是收到大量的剧本。你怎么预测哪个剧本拍出来能赚钱呢?假设现在我们已经找到了剧本的秘密,那就是一个电影要想赚钱,其中必须有一定程度的“性”,和一定程度的“暴力”。假设下面这张表格,就是剧本的真理,
表格使用性和暴力两个维度,按照“无、低、中、高”的标准,建立了一个坐标系。表格中“B”代表对利润不好(Bad),“G”代表对利润好(Good)。总体来说,是性和暴力元素越多越好,但这个趋势并不是绝对的。比如高度的性和低度的暴力结合起来能赚钱,可是高度的性和没有暴力结合起来就不赚钱,而中度的性和没有暴力结合反而又赚钱。
你可能会质问这个表格有什么道理,但是这不重要,这只是佩奇设计的一道数学题。我们假装这个表格是绝对正确的。表格构成了一个二维的视角。
现在我们看看预测模型。雷,玛丽莲和德博拉,是三个负责审查剧本的电影公司雇员,但是因为他们的水平有限,他们并不知道上面那个表格中的真理。事实上,他们只能看到更简单的分类,也就是解读。
雷只关心性元素。雷把剧本按照性元素分成无、低、中、高四类,多年的经验告诉他,性元素是中和高的就是好剧本,无和低的就是坏剧本。这就是雷的预测模型。对照前面那张表格,你会发现雷这个模型的预测准确度是75%。
同样地,玛丽莲只关心暴力元素,她使用同样的分类方法和预测标准,所以她的预测准确度也是75%。
我们雷和玛丽莲的解读方法都是忽略视角的一个维度,这正是我们前面说的“投影解读”。
德博拉的预测模型比较怪,是一种“聚丛解读”。他的解读方式是按照表格的内部、边线和四个角来进行分类,他认为内部的太无趣,边线上是和谐的,而四个角是极端的,他认为只有和谐能赚钱,而极端和无趣不赚钱,所以德博拉的预测模型是下面这样,
如果你仔细对照一下代表真理的表格,你会发现,德博拉的预测准确度也是75%。
同样的视角,三个人,使用三个解读的三种不同的预测模型,得到了同样的准确率。这就是今天佩奇最想告诉你的道理,
预测模型,常常不会胜者通吃。
我们以前说过一个道理,只有竞争不充分的领域里才有英雄。如果竞争很充分,大家互相模仿,那么市场很快就会变得“同质化”,最好的做法会被所有人模仿。那根据这个道理,每个人都应该使用最好的预测模型啊。
只有在数据足够充分的情况下,各个模型才会慢慢演化成一样的。生活中更常见的是像雷,玛丽莲和德博拉那样,各个模型不一样,可是准确率却差不多,谁也淘汰不了谁。
我们对世界的认识是有局限的。
而这恰恰就是为什么我们要保留多样性。
每一个解读,都要忽略一些东西。每一个预测模型,都是主观的选择。不分类,你就没效率;分类,你就会歧视。这个矛盾到底要怎样解决呢?
答案就是多样性。别忘了真正的多样性是思维方式的多样性。你有你的分类标准,我也有我的。你说乒乓球运动员没思想,可我眼中的她是个真诚的人,而我的预测模型认为真诚的声音总是值得听的。允许多样性的视角、解读和预测,你就能不偏颇。
多样性,是歧视的解药。
五、文无第一,武无第二
前面我们讲了“多样性优于能力”的原理,和“多样性认知工具箱”中的四种工具,这章的主题是我们应该怎样利用多样性。
佩奇这本书的一个重要特点是其中有一些有意思又不太难的数学,咱们还是先从几道数学题说起。
0x1:多样性的“超加性”
以下这三个数列都是按照一定的规律排列的,请你猜一猜数列中的 X 是什么数。
- 第一题:1,4,9,16,X,36
- 第二题:1,2,3,5,X,13
- 第三题:1,2,6,X,1806
前两题比较简单。第一题你一看就知道都是自然数的平方,前面四个分别是 1,2,3,4 的平方,所以 X 应该是 5 的平方,也就是 25,跟下一个数 36 正好能连上。
第二题,需要考虑每个数字跟它前面数字的关系,3=1+2,5=2+3,那么下一个数字就应该是 X = 3+5=8。这样再下一个数,正好是 5+8=13。
如果让一个从来没做过这种找规律题的小学生直接做第三题,他可能会感到毫无头绪。但是如果你有了做前面两道那样比较简单的找规律题的经验,你就容易发现第三题的门道。
事实上,解前两道题,你使用了两个不同的视角,分别是“平方数”和“求和”。这两个视角将会帮助你解决第三题!
咱们先拿第三题的前三个数字,1,2,6,做个加减法。2-1=1,6-2=4,相邻两个数字之差,正好分别是1的平方和2的平方。
那是否每个数字,都是它前面那个数字,自己加上自己的平方呢?那么 X=6+6^2=42。再看下一个数,42+42^2,正好是1806。问题解决了。
这种给数列找规律的题目,其实都有一定的运气成分:你一旦想到了就发现很简单,要是想不到就怎么也解不了。但求解真实世界的问题不也是这样吗?所谓想到,就是你找到了正确的视角。如果一个人根本就不知道“平方”这个概念,他就无论如何都做不出来。你会的视角越有多样性,你就越容易想到。
而佩奇用这三道题目想要告诉我们的是,多样性具有“超加性(superadditivity)”。把两个视角“加”起来,有利于你解决新的问题。这也正是我们常说的,创造性就是“想法的连接”。
好,现在使用一点排列组合知识。如果你只会两个视角,那你就只有一对连接。而如果你会5个视角,理论上你一共可以有5×4/2 = 10个连接,相当于五个点两两之间都连一条线:
而你要是有10个视角,你可以有10×9/2=45个连接。因为视角的这个超加性,多样性的好处会不成比例的增加。
这是“工具箱”的多样性。接下来咱们再从数学角度,探讨一下“人”的多样性。
0x2:三人行必有我师的数学原理
你注意到没有,生活中有时候会有像石头剪子布一样“循环相克”的现象。
- 比如满清末年中国流传一个说法叫“官怕洋人、洋人怕百姓、百姓怕官”
- 在足球比赛中,也常会有“A 队怕 B 队的逼抢,B 队怕 C 队的技术,而 C 队又怕 A 队的身高”这样的局面。
出现循环相克的根本原因,就在于他们比的不是一个单项技能,而是一个工具箱。
如果大家只比一个维度,比如说速度,那的确是如果 A>B 而 B>C,则必有 A>C,你可以把所有人搞个排名。可是如果要考察综合的能力,每个人都有多项技能,排名其实是没有意义的。
其实咱们想想,高考按照总成绩排名,这个做法是值得商榷的。王同学数学120分,语文80分,英语70分,总成绩270分;张同学数学、语文和英语都是95分,总成绩285分。按通用的标准,张同学优于王同学。可是真的如此吗?如果是报考数学系呢?王同学的数学成绩出类拔萃,张同学只能算一般优秀。
从多样性角度,到底应该录取谁,可不一定。
佩奇提出,评估人的能力不能只看一个单独的数字,而应该考察她所拥有的“工具箱”。这个工具箱里的工具可以是所有的知识、技能、视角、启发式等等,可以有很多很多个。
考虑工具箱,那么你就会发现,几乎每个人都有他独特的价值。
佩奇举了个例子。现在我们假设一共有52个可以掌握的工具,两个学生,芭比会其中20个工具,卡尔会其中15个工具。芭比会的东西比卡尔多,那你能说,卡尔跟芭比一比就是个可以忽略的人才吗?
佩奇弄了个严格的定义。所谓“可不可以忽略”,就是到底有多大的可能性,卡尔会的这些工具,芭比全都会。这个可能性之低会让你震惊。
具体的计算过程很有意思但是我们就不讲了,我们直接说结论。佩奇考察了三种情况。
- 第一种情况是所有这些工具都是互相独立的。
比如像会计记账法、广告设计和流行音乐作曲,你想学哪个可以直接学,不用先学了第一项才能再学第二项。这种情况芭比和卡尔相当于是从52个工具里随便选择20个和15个工具。
我不知道你是否曾经考虑过这个事儿。比如一次期末考试之后,你看着全班同学的成绩单,发现有个同学,他的每一门考试的成绩都在你之下,等于是他会的你都会,这种感觉恐怕是非常令人愉快的。
当然这里我们不考虑卡尔和芭比在每个工具上的得分是多少,只要会了就算会了。那有多大可能性,卡尔会的这15个工具,芭比都会呢?
答案是……3亿分之一。芭比比卡尔会的多,但是芭比极其不可能对卡尔形成全覆盖。
芭比完全可以从卡尔身上学点东西。这就是“三人行,必有我师”的数学原理。
那你可能会说,这个模型不太好,52个可选技能应该是互相有联系的,你得先学会算数才能学代数,学了代数才能学微积分啊?
- 这就是佩奇考察的第二种情况。如果所有的技能都排成了一架梯子,你按照技能1、技能2、技能3的顺序学,那的确,卡尔会的东西肯定芭比全都会。
但你也要考虑到,真实世界并不是所有的技能都在一架梯子上。也许有好几架梯子,芭比和卡尔在各个梯子上都有一些涉猎。对此佩奇做了计算,结果如下图,
哪怕只有两架梯子,芭比对卡尔全覆盖的概率就只有29%。而如果有5架梯子,这个概率就小于0.01%。
佩奇还考虑了各个工具排成树状的情况,也就是从同一个基础工具出发,可以有不同的高级工具,如下图,
这种情况下芭比全覆盖卡尔的概率仍然是非常非常低。所以我们的结论是这样的:不管工具之间的关系如何,哪怕一个人会的工具不如别人多,他也有自己的价值。
0x3:三个道理
从这章说的这些结论,我们大约可以获得三个道理。
- 第一个道理是,个人应该多掌握几个工具,而公司用人,应该多考虑多样性。
多掌握几个工具,你得到的不仅仅是这几个工具,而且是大大多出来的工具之间的组合连接。我们讲过狐狸的预测水平超过刺猬,城市人口越多创新能力就越强,这就是工具连接的规模效应。给自己的团队多几个视角,你解决问题的能力会大大增加。
佩奇设计了一个例子。比如你们公司招聘,出了10道题。三个应聘者,斯宾塞答对了5道,杰夫答对了7道,罗斯答对了6道,请问你应该录取谁呢?如果只看答对多少题,那似乎应该是杰夫和罗斯,但是,你更应该关注他们答对的是哪些题。
下面这张图是三人答题的结果,
杰夫会的最多,我们肯定要他了。那么考虑到跟杰夫的配合,你会发现斯宾塞更合适。罗斯会的六道题,杰夫全都会,所以有杰夫,罗斯就没啥用。可是斯宾塞会的五道题里,有四道是杰夫不会的!所以你应该选杰夫和斯宾塞,而不是杰夫和罗斯。
公司招人,美国大学录取学生,包括《中国好声音》的老师选择战队,都有这种考虑。这就引出了我们的第二个道理。
- 第二个道理是,想要获得更多机会,你应该尽量掌握几个跟别人不重合的技能。
以幼儿园招聘为例子,说幼儿园应该招聘更多的男老师,就是这个道理。幼儿园和小学老师其实是很不错的职业,如果一个男生选择这样的职业,他可以给孩子带来男性的视角。“性别男”这个属性本身,就已经是不可替代的。
老师这个工作很不错,所以这不是“冷门”,这是“不容易被覆盖的工具”。
- 第三个道理比较高级。有的人喜欢涉猎广泛什么技能都稍微学一点,但也有的人喜欢深入钻研一门技能。我们以前说过,前者容易陷入“达芬奇诅咒”,而后者容易变成“刺猬”。但是这两种人都有各自可以从事的领域。
回到前面佩奇说的工具梯子和工具树的模型,你要考察的是这个领域里的梯子或者树,多不多。如果梯子和树很多,那就说明它需要的工具没有很好的结构性,每个工具的门槛都比较低,适合达芬奇人格。如果只有一两个梯子和树,那就需要你集中精力在一个方向上钻研。
佩奇列举了不同学术领域和不同职业中梯子和树的多少,
这张表说的就是文无第一武无第二!
- 像运动员和理工科这样的领域,真是需要你深耕,而且因为工具呈现梯子和树状结构,技能容易全覆盖,不同的人水平高低容易看出来,谁行谁不行一目了然。
- 而像文科和商科这些领域,因为各个工具比较独立,技能无法全覆盖,人和人之间的水平高低就不好排序了。
这也就是为什么,数学家通常认为智商很重要,而文学教授则认为见识比智商重要。
那你选哪种呢?这取决于你是达·芬奇,还是刺猬。
六、多样性的噩梦
我们前面一直在讲多样性的好处,这章我们来讨论多样性可能带来的一个大问题。
为此我想先讲一个故事。这件事来自博弈论专家布鲁斯·布恩诺·德·梅斯奎塔的《预测师的博弈论》(The Predictioneer’s Game)一书,据说是作者,以下我们简称他为“布老师”的亲身事迹。
这是一个权斗故事。
从前有个公司,老CEO,咱们干脆就管他叫张总吧,马上要退休了,公司董事会准备投票选出一位新的 CEO。候选人一共有五位,我们干脆叫他们老马、老赵、老李、老陈、老王。董事会说了算的一共有五位董事,他们人手一票。张总非常清楚这五个董事心中对各个候选人喜好程度的排序,但是他不喜欢这个排序。
这五个董事心目中的CEO选择顺序是下面这样 ——
- 1. 马、赵、李、陈、王;
- 2. 马、王、陈、李、赵;
- 3. 王、马、陈、李、赵;
- 4. 赵、王、陈、李、马;
- 5. 李、赵、陈、王、马。
很明显,如果直接投票,老马将会以两票当选。可是张总非常不喜欢老马,张总最喜欢的人选其实是老陈,可是老陈在所有董事心目中的排序都没进前两名,真是不行啊。张总花费重金,请布老师给出个主意。
布老师是斯坦福大学胡佛研究所的研究员,还是纽约大学的政治学教授,同时自己开了一家咨询公司,专门给政府和企业提供战略咨询服务。布老师一看这份名单,乐了。
布老师说,张总,你作为现任CEO,是不是有权决定选举的议程?张总说那肯定有啊,我说怎么选就怎么选……可是选举还是符合要少数服从多数的原则,否则难以服众啊。
布老师说,这就好。你要这么、这么、这么办……
选举这天,张总亲自主持会议。张总说,据我了解,大家对人选的意见比较有分歧,没有候选人达成了绝对的多数,所以我建议,咱们用两两对决的方式、一轮一轮地选,这样每轮的赞成票都能超过半数。董事会说可以啊。张总说,既然老马和老王是最热门的两个人选,咱们第一轮就让老马对老王。
老马在两个董事心中排第一位,但是老王在3、4、5号董事心中的排位顺序都高于老马,结果第一轮投票老王胜出,最大热门老马惨遭淘汰!
第二轮,张总让老王对老赵。结果老赵以 3:2 又淘汰了老王。张总笑而不语。
第三轮,张总提议让老李上,结果老李 3:2 淘汰了老赵。
至此只剩下老李和老陈两位候选人……结果最后一轮老陈 3:2 战胜老李。张总宣布,经过董事会的层层选拔,整个选举过程实现了公开公平公正的原则,程序合法,老陈,当选 CEO!
董事们面面相觑,完全不知道发生了什么。怎么不声不响的老陈就当选了呢?而且还是我们选的!
0x1:偏好与理性
现在有很多心理学家和行为经济学家认为人是非理性的,但是也有不少传统经济学家坚持认为人在绝大多数情况下是非常理性的。经济学家对“理性”有个非常简单的定义:你知道你想要什么。
比如说你想要省钱。现在有两台一模一样的 iPhone X,一台要价10000元,另一台要价9995元,那么你就会选择第二台。这就是理性。
你有所偏好,并且能按照自己的偏好做出选择,你就是理性的。当然,作为理性的人,你的偏好必须具有“可传递性”:如果你认为苹果比香蕉好吃,橘子比苹果好吃,那么你就应该认为橘子比香蕉好吃。也就是说:如果 A>B, B>C,那么必然有 A>C。
这个要求不过分吧?从数学上讲,我们还要求理性的你必须能对所有可选的东西都有个排序,比如对任意的 A 和 B,你都能排出来,或者 A>B,或者 A<B,或者如果你认为 A 和 B 差不多,也可以说 A=B,但是你必须给个确定的关系,这个要求叫做“完备性”。这也不过分吧?
有了偏好选择的完备性和可传递性,你就是个理性的人了。在你心目中,什么重要什么不重要,有一个清晰的顺序。当然这个顺序是可以随着时间变化的,也许今天的你喜欢吃面条,明天你又更喜欢米饭了。但是这没关系,在数学上,我们放宽条件,只要此时此刻的你有明确的偏好顺序,就认为你是理性的。
在这个意义上说,个人,是非常理性的。
但是,群体,却没有这种理性。
0x2:群体有偏好吗?
我们专栏以前讲启蒙运动的时候说过一个道理,所谓“国家利益”,其实是个幻觉。个人有利益,国家其实没有利益。翻译成今天的数学语言,那就是个人有偏好,但是由个人组成的群体,是没有偏好的。
那你可能会说,不对啊,可以投票啊,群体里多数人的偏好,就是群体的偏好!佩奇书中有个简单例子,能告诉你为什么不是这样。
比如现在有个三人委员会,要在A、B、C三个城市之中选择一个,作为奥运会的举办城市。这三个人的偏好都满足完备性和可传递性,他们心目中的优先顺序分别是 ——
- 1. A>B>C
- 2. C>A>B
- 3. B>C>A
那么我们看看这三人组成的这个群体,对 A、B、C 三个城市的偏好是怎样的。如果是投票表决,那么在 A 和 B 之间选择的话,A 会以 2:1 战胜 B,所以群体认为 A>B,对吧?
好,现在你让群体在 B 和 C 之间选,又会得到 B>C。可是与此同时,如果让群体在 C 和 A 之间选,又会有 C>A!
A>B,B>C,同时 C>A?!偏好的可传递性,哪里去了?
没有传递性,就说明你这个群体根本没有一个准主意,你是非理性的。
群体没有偏好。这就是著名的“阿罗不可能定理”,由肯尼斯·阿罗证明,阿罗不可能定理是社会科学中最大的悖论之一。你每次听人说什么“集体的决定”或者“群体的利益”,应该首先想到这个定理。
严格地说,阿罗定理是说,群体偏好,不可能同时满足下面这四个听起来非常合理的要求,
- 第一,群体偏好必须是完备和可传递的。也就是说,群体偏好要具有跟个人偏好一样的理性特点。
- 第二,群体偏好不能违背全体个体的一致选择。也就是说,如果现在所有人都认为 A 好于 B,那你群体必须认为 A 好于 B。
- 第三,跟现有选项无关的东西,不能干扰群体偏好。也就是说,如果我们现在根本就没考虑这个候选人,你不能把这个候选人添加进来,干扰群体判断结果。这一点在打分制的投票中很重要。
- 第四,其中没有独裁者。
你看这四个要求,哪个都是合理、甚至简单到简直就是废话,可是阿罗恰恰证明了,它们不可能总被满足。刚才说的从 A、B、C三个城市中选一个的例子,就是证据。
正是因为阿罗不可能定理的存在,所谓的投票表决就有可能出毛病。我们今天开头讲的布老师设计选 CEO 的故事就是这样一个例子。这个毛病就在于,因为群体偏好可能具有不可传递性,那么不同的选举议程,就完全可能产生不同的选举结果。
佩奇举了个最简单的例子。比如我们要在石头、剪刀、布中间选出一个。因为这三个东西的偏好具有不可传递性,是循环的,所以选举结果完全取决于出场顺序:
如果是石头和剪刀先出场,最后就会是布胜出。
而如果是布和石头先出场,最后就会是剪刀胜出。
所以如果根本就不存在群体偏好,那投票不就成了儿戏吗?往大了说,民主选举还有效吗?
0x3:目的和手段
经常有人把阿罗不可能定理当做民主制度无效的证据,真实世界中也的确有很多操纵选举的例子,但是佩奇对此没有那么悲观。关键在于,我们要区分两种偏好。
- 第一种叫“基础偏好(fundamental preferences)”,是关于结果的偏好。比如说,中超联赛只能有一个冠军,我希望是黑龙江火山鸣泉队,而你希望是广州恒大队,那咱俩就是基础偏好不同。这是一种不可调和的矛盾。
- 第二种叫“工具偏好(instrumental preferences)”,是关于应该怎么办的偏好。比如说,我认为中国队应该加强进攻,使用433阵型,而你认为应该加强防守,使用442阵型,但是咱俩的出发点都是为了中国队赢球,这就是工具偏好不同。
基础偏好说的是目的,工具偏好说的是手段。
工具偏好的多样性其实是个好事儿。我们来自五湖四海,每个人有不同的视角、启发式、解读和预测模型,但是是为了同一个目标走到一起来了,那么大家完全可以集思广益,就算集体决策得出非常不符合自己设想的结论,也都能接受。
但是基础偏好要是不一样,可就麻烦了。我认为这个资源应该给我,你说应该给你,那咱俩投票有意义吗?基础偏好的多样性简直就是噩梦。
但是佩奇说,其实民主国家投票,绝大多数情况下还是在选择手段而不是目的。毕竟哪个候选人都会说要提高全国各地的教育水平,没有谁会公开说应该牺牲山东考生的利益多给北京几个名额。
不过佩奇也承认,如果一个群体内部存在基础偏好的重大分歧,那么在分配资源的时候,就会牺牲公共资源。特别是,如果一个穷国是个多民族国家,如果各个民族没有多少共同利益,那么就很可能各自为政,甚至搞分裂。
民族多样性对发达国家是个好事儿,因为社会融合度高,身份的多样性能带来工具多样性,思想活跃,决策更科学,不容易犯错误。但是对穷国来说,就可能是个问题。
所以归根结底,一帮人在一起,思想越多样越好,但是价值观最好求同,这才是君子和而不同。
七、多样性智慧
0x1:多样性好处的数学公式
- (1)群体能力 = 平均个人能力 + 多样性
- (2)多样性 > 能力
- (3)群体预测的方差 = 群体中个人预测的方差的平均值 - 群体多样性。
0x2:多样性产生红利的条件
0x3:多样性认知工具箱
第一个工具:视角
所谓视角,就是你“怎么看”这个东西,你把这个东西“看成什么”。
视角的三个洞见:
- 1、视角的选择,对解题的难易,关系重大。
- 2、要想有利于解题,你这个视角最好自带某种结构。
- 3、对任何一个问题,都存在一个能让答案一目了然、脱颖而出的视角。
“学者存在性定理(Savant Existance Theroem)给了我们希望。一道难题摆在面前,可能当前谁都不知道怎么解决,但是你要相信,总有一个视角,会让答案看上去那么简单,能够脱颖而出。
第二个工具:启发式
“启发式是这么一个规则:在某个视角里,使用这个规则能够得到一个解,那么你受此启发,也许可以把这个规则用在别的问题上,得到别的解。”
启发式就是思维的套路。更基本的含义,大约可以称为“思维快捷方式”。
第三个工具:解读
解读,就是在一个视角之下,把东西做进一步的分类。
- 投影解读:如果你的分类方法是选择视角中的一个维度并且忽略其他维度,那就叫“投影解读(projection interpretation)”。
- 聚丛解读:你也可以不管什么维度,任意选择几个东西说它们就是一类,这就叫“聚丛解读(clumping interpretation)”。
第四个工具:预测模型
预测模型 = 分类解读 + 预测
每一个解读,都要忽略一些东西。每一个预测模型,都是主观的选择。不分类,你就没效率;分类,你就会歧视。解决这个矛盾,就需要多样性。
0x4:怎样利用多样性
多样性具有“超加性(superadditivity)”。把两个视角“加”起来,有利于你解决新的问题。这也正是我们常说的,创造性就是“想法的连接”。
如果你只会两个视角,那你就只有一对连接。而如果你会5个视角,理论上你一共可以有5×4/2 = 10个连接。而你要是有10个视角,你可以有10×9/2=45个连接。因为视角的这个超加性,多样性的好处会不成比例的增加。
因为多样性的特点和好处,你应该这样利用多样性:
- 个人应该多掌握几个工具,而公司用人,应该多考虑多样性。
- 想要获得更多机会,你应该尽量掌握几个跟别人不重合的技能。
- 有的人喜欢涉猎广泛什么技能都稍微学一点,但也有的人喜欢深入钻研一门技能。我们以前说过,前者容易陷入“达芬奇诅咒”,而后者容易变成“刺猬”。但是这两种人都有各自可以从事的领域。
0x5:也要小心多样性
个人是非常理性的。但是,群体,却没有这种理性。
个人有偏好,但是由个人组成的群体,是没有偏好的。群体没有偏好,就是著名的“阿罗不可能定理”,由肯尼斯·阿罗证明,阿罗不可能定理是社会科学中最大的悖论之一。你每次听人说什么“集体的决定”或者“群体的利益”,应该首先想到这个定理。
但是应该区分两种偏好:
- “基础偏好(fundamental preferences)”,是关于结果的偏好,是目的。基础偏好要是不一样,可就麻烦了。基础偏好的多样性简直就是噩梦。
- “工具偏好(instrumental preferences)”,是关于应该怎么办的偏好,是手段。工具偏好的多样性是好事:每个人有不同的视角、启发式、解读和预测模型,但是目标一致。
归根结底,一帮人在一起,思想越多样越好,但是价值观最好求同,这才是君子和而不同。