Fork me on GitHub

对 GAN 的 value function 的理解

 

 


上式分为两个步骤:

  • 第一步:调整discriminative model D的权重,使得V中两项取得最大值
  • 第二步:调整generative model G的权重,使得V中第二项取得最小值

首先,分析log D(x)的含义:

  • D(x)表示discriminative model D对一个原始样本的评分,评分越高,表示D越趋向于相信该样本是一个真实样本
  • D(G(z))表示discriminative model D对一个生成样本的评分,评分越高,表示D越趋向于把一个生成样本当成了一个真实样本

因此,网络训练过程总结如下:

  • 第一步:训练D,使得上述两个期望最大
    • 第一项期望值最大,表示D将一个真实样本给出一个高的评分
    • 第二项期望值最大,表示D将一个生成样本给出一个低分
  • 第二步:训练G,使得期望值的第二项最小
    • 第二项期望值最小,即:找到一个G,使其生成的样本能够在discriminative model D中获得一个较高的评分

 

图:GAN的训练收敛过程

蓝色表示D

绿色表示G

黑色表示原数据


 

2019年8月18日

于南湖畔

posted @ 2019-08-18 19:45  stardsd  阅读(786)  评论(0编辑  收藏  举报