39、GAN原理

1、p(x)是训练集的数据的分布的概率,无需事先知道,网络会自动进行学习,p(x)只是为了方便公式的推导和证明。

2、鉴别器学习真实数据的分布pr(x),生成器生成一个假的分布pg(x),然后最小化两个分布的距离,在达到纳什均衡时,pr(x)就会非常的接近pg(x),

   

3、训练函数

  

真实的x —> D网络 ==> D(x),噪声z—>G ==>xg' —>D ==> D(G(x)) 

4、

(1)数学期望:在概率论中,将实验中每次可能产生的结果的概率乘以其结果的总和,反映随机变量平均取值的大小。根据其随机变量的取值范围不同,分为离散型和连续型/

离散型: (E是期望)

  

对于连续型随机变量x,其概率密度函数为f(x),则X的数学期望E(x)可以表示成微积分的形式

      

 (2)KL散度的定义

KL散度:在信息论中,用生成的概率分布Q来拟合逼近真实的概率分布P时,所产生的信息损耗,即描述两个概率分布的差异,其本身是非对称的

设x是连续型随机变量,其真实概率分布为P(x),拟合分布概率为Q(x),则P对Q的KL散度为

    

(3)零和博弈

指参与博弈的双方,在严格的竞争下,一方的收益必然意味着另一方的损失,博弈过程中,双方的各自收益和损失的相加总和永远为零,双方完全不存在合作的可能。下棋双方的每一步棋都是向着自己最有利的方向走,最终只有一方赢一方输,而下棋的总成绩永远为零。GAN也是由博弈双方组成,分别为生成网络G(Generator)判别网络D(Discriminator)
    
 
 
 
posted on 2020-01-08 11:02  Luaser  阅读(641)  评论(0编辑  收藏  举报