GAN——ModeCollapse

2017年05月21日 13:54:31 LiuSpark 阅读数 6821更多

分类专栏：机器学习

本文链接：https://blog.csdn.net/SPARKKKK/article/details/72598041

大部分内容来源于李宏毅的课程[1]

Example

先给一个直观的例子，这个是在我们训练GAN的时候经常出现的

这就是所谓的Mode Collapse

但是实际中ModeCollapse不能像这个一样这么容易被发现(sample中出现完全一模一样的图片)

例如训练集有很多种类别(如猫狗牛羊)，但是我们只能生成狗(或猫或牛或羊)，虽然生成的狗的图片质量特别好，但是！整个G就只能生成狗，根本没法生成猫牛羊，陷入一种训练结果不好的状态。这和我们对GAN的预期是相悖的。

Analysis

如上图。 $P_{d a t a}$

李宏毅原话：

在step10k的时候，G的位置在某一个 Gaussian所在位置，然后D发现G只是在这个Gaussian这里了，所以就把这个地方的所有data(无论real还是fake)都给判定为fake

G发现在这个Gaussian待不下去了，只会被D永远判定为fake，所以就想着换到另一个地方。在step15k就跳到了另一个Gaussian上去

然后不断跳跳跳，不断重复上述两个过程，就像猫捉老鼠的过程一样，然后就没有办法停下来，没法达到我们理想中映射到8个不同的Gaussian上面去

对于左边的KL散度，出现无穷大的KL散度是因为 $P_{d a t a}$

对于右边的reverse KL散度，如果出现了 $P_{G}$

Reference

[1]Youtube-MLDS Lecture 9: Generative Adversarial Network
[2]知乎专栏——令人拍案叫绝的Wasserstein GAN

posted on 2019-09-15 16:06 曹明阅读(496) 评论(0) 收藏举报