机器学习笔记11 ( Explainable ML )

Explainable ML

机器学习，不仅要能判别input是什么，并且需要给出 reason？

1、Explainable ML

1）是什么？

2）为什么？

2、Local Explanation: Explain the Decision

Questions: Why do you think this image is a cat?

3、GLOBAL EXPLANATION: EXPLAIN THE WHOLE MODEL

Question: What do you think a “cat” looks like?

4、Using a model to explain another

1、Explainable ML

1）是什么？

EXPLAINABLE MACHINE LEARNING ：让机器在判断input的同时，需要知道为什么这样判断。

2）为什么？

2、Local Explanation: Explain the Decision

Questions: Why do you think this image is a cat?

我们需要知道机器是通过input 的哪部分，来确定输入的是个什么东西的。

因此我们将input 分为几个部分，通过像素、点等。在语音识别里可能是个字等。

但是我们如何知道，机器是通过哪部分来判别的呢？

方法一：通过一块灰色方块遮挡住图片的部分，如果挡在一个地方使得机器不能正确识别，说明这个地方就很重要

如下图，蓝色的区域，表示如果将灰色方块放在这个地方，识别成功的概率就很低，说明这地方很重要。

方法二：

在input 向量的某个地方加上一部分，则得到的 yk(被辨识出来的机率) 也会产生变化，并求output 与 input 的变化比/偏微分，如果某个地方很重要，则在这个地方的微分也就越大。

如下图黑色中间亮的区域，表示微分值比较大，也就是比较重要。

此方法的限制

对于我们人类而言，大象的鼻子足够长我们就可以认为这是一只大象，就算再长也不会影响我们的判断了；但是对于机器，在长到一定程度时，求微分就会得到0，也就是机器会觉得，鼻子长度和input 是不是大象没有关系。显然不太对。

3、GLOBAL EXPLANATION: EXPLAIN THE WHOLE MODEL

Question: What do you think a “cat” looks like?

1）我们想要知道，机器眼中的某个东西应该是什么样子？

在以往的操作中，都是给一个input ，机器判断input 是个什么东西，并给出是这个东西的概率，比如数字8，但是我们现在反过来做，我们想要知道机器眼中的数字8是什么样子，我们就把input 判断为8 的概率 yi拿出来，我们要寻找一个input，使得能让机器把 input 判别为 8 的东西的概率yi 最大。此时的input 也就是x star 就是机器眼中的 8 的什么样子。

但是呢，前面攻击和防御的课里我们说过，一段浑浊的干扰，就能让机器把他判别为任何我们想要的东西，但是我们想要知道机器眼中的东西是什么样子，就要尽可能使得这个东西干净（除了这个东西没有别的东西）。比如一块白板上只有一个数字 8 其余的地方什么都没有。

因此修改 function，在后面加上R(X)，表示的含义是，内容尽可能地少，一块白板，没有东西的的地方也就是0，只有有数字的地方是黑色的，因此也就有值。

2）让机器自己画一个我们想要的东西

首先，我们需要train一个model G，它可以给一个 input ，然后output 一个 image。但是这个image 我们无法控制。

在上面，我们会给一个要求的东西，然后会找到一张图片使得机器认为这个图片就是我们要求的东西，现在我们在前面再加一步，给一个向量，让G产生一张image，然后把这个image丢进分类器中，让他会觉得这个图片是我们想要的东西的概率最大。因此我们就会得到一个向量使得这个东西是我们想要的东西。然后把这个向量丢进G，产生的图片也就是我们想要的图片。