因果关系发现进展及其应用--蔡瑞初 广东工业大学

 

因果关系发现进展及其应用--蔡瑞初 广东工业大学

https://www.bilibili.com/video/BV14i4y1Z7aS/?spm_id_from=333.788.recommend_more_video.3&vd_source=3ad05e655a5ea14063a9fd1c0dcdee3e

 

吸烟、黄牙、肺癌三者之间是相关的。但是吸烟可以引致其他二者。但是其他二者之间确实没有之间因果关系的。

 

 

 

胆固醇和运动量之间的关系。运动会导致胆固醇升高。

但是年龄是背后的决定因素。年龄不仅影响胆固醇量二期还影响运动量。

 

女生和男生智商的高低。当时困惑了统计学家好久。然后发现当时男女不平等,女生要想进入大学,要么确实很聪明,要么家里有钱。而家里有钱也在一定程度上增加了女性的知识;然后在女生进入大学后,经过大学的教育,那么IQ测试结果会更好。所以才有了上述女生智商高的错误结果。也就使得性别和智商之间发生了一些伪关联(如果没考虑进入大学的条件的话,那么有可能就发现不了了)。可以发现因果可以帮我们厘清一些在统计上很困惑的问题。

 

以下从人工智能角度看一下 :

在医院里拍片的结果显示某个部位有病变,这个是what问题,现在是没问题了。

但是对于why 和 how,现在人工智能还是回答的不太好。

医生对于why可能回答最近的天气干燥、空气质量等情况导致的,也可能回答是病人抽烟抽多了导致的。但是机器没法回答这样的答案。

而how是怎么解决某个问题,比如医生可以给你从说一下源头在哪,比如让患者戒烟,从而减轻病症。

而后面的两个why和how,则常常需要依赖于因果关系。

why和how其实就是更多的解决抽象和推理问题。

 

以上两位图灵奖得主说过类似的意思。

从干预到反事实。

 

因果之前是从数据出发,然后用数据验证。

而因果不同,因果很重要的点是一定要因果假设。

做因果假设第一个就是因果马尔可夫假设;其实给定了马尔可夫场以后,给定其直接父辈们以后,他和其他的变量之间是独立的。

因果忠诚行假设是说数据之间的独立性是在因果图上或马尔可夫假设下是成立的,就这样一个假设我们可以做一个假设,我们可以做一类以下的因果发生算法。也即是基于约束的算法。

基于约束的方法也较多。在此不细述。

比如上图上部的给定x2后,x1和X3是独立的。那么可能推断背后的因果结构是其右边虚线框中的三者之一。

同理如果知道x1和x3独立,但是给定x2后,他们又不独立了,那么我们可能推断他们之间就可能形成了v结构。

也就是说这是基于约束类假设的最基本的思想;其韵涵了前面的最基本的假设,也即独立性和图上的关系是有对应的关系的。我们可以基于这一对应关系设计一系列复杂的算法来做,比如下图的是两位CMU的教授2000年左右提出的PC (peter-clark)算法;比如知道了如下图右边X1到X5的结构,那么如何来推断呢?

 

posted on 2022-06-24 17:41  lmqljt  阅读(298)  评论(0编辑  收藏  举报

导航