上一页 1 2 3 4 5 6 ··· 32 下一页
摘要: 在《变分自编码器(五):VAE + BN = 更好的VAE》中,我们讲到了NLP中训练VAE时常见的KL散度消失现象,并且提到了通过BN来使得KL散度项有一个正的下界,从而保证KL散度项不会消失。事实上,早在2018年的时候,就有类似思想的工作就被提出了,它们是通过在VAE中改用新的先验分布和后验分 阅读全文
posted @ 2024-07-08 16:36 jasonzhangxianrong 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 前段时间公司组织技术分享,轮到笔者时,大家希望我讲讲VAE。鉴于之前笔者也写过变分自编码器系列,所以对笔者来说应该也不是特别难的事情,因此就答应了下来,后来仔细一想才觉得犯难:怎么讲才好呢? 对于VAE来说,之前笔者有两篇比较系统的介绍:《变分自编码器(一):原来是这么一回事》和《变分自编码器(二) 阅读全文
posted @ 2024-07-08 16:35 jasonzhangxianrong 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 昨天早上,笔者在日常刷arixv的时候,然后被一篇新出来的论文震惊了!论文名字叫做《NVAE: A Deep Hierarchical Variational Autoencoder》,顾名思义是做VAE的改进工作的,提出了一个叫NVAE的新模型。说实话,笔者点进去的时候是不抱什么希望的,因为笔者也 阅读全文
posted @ 2024-07-08 16:34 jasonzhangxianrong 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 本文我们继续之前的变分自编码器系列,分析一下如何防止NLP中的VAE模型出现“KL散度消失(KL Vanishing)”现象。本文受到参考文献是ACL 2020的论文《A Batch Normalized Inference Network Keeps the KL Vanishing Away》的 阅读全文
posted @ 2024-07-08 16:33 jasonzhangxianrong 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 这是一篇“散文”,我们来谈一下有着千丝万缕联系的三个东西:变分自编码器、信息瓶颈、正态分布。 众所周知,变分自编码器是一个很经典的生成模型,但实际上它有着超越生成模型的含义;而对于信息瓶颈,大家也许相对陌生一些,然而事实上信息瓶颈在去年也热闹了一阵子;至于正态分布,那就不用说了,它几乎跟所有机器学习 阅读全文
posted @ 2024-07-08 16:32 jasonzhangxianrong 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 这篇文章很简短,主要描述的是一个很有用、也不复杂、但是我居然这么久才发现的事实~ 在《深度学习的互信息:无监督提取特征》一文中,我们通过先验分布和最大化互信息两个loss的加权组合来得到Deep INFOMAX模型最后的loss。在那篇文章中,虽然把故事讲完了,但是某种意义上来说,那只是个拼凑的lo 阅读全文
posted @ 2024-07-08 16:30 jasonzhangxianrong 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 这篇文章是我们前几天挂到arxiv上的论文的中文版。在这篇论文中,我们给出了结合流模型(如前面介绍的Glow)和变分自编码器的一种思路,称之为f-VAEs。理论可以证明f-VAEs是囊括流模型和变分自编码器的更一般的框架,而实验表明相比于原始的Glow模型,f-VAEs收敛更快,并且能在更小的网络规 阅读全文
posted @ 2024-07-08 16:29 jasonzhangxianrong 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 由于VAE中既有编码器又有解码器(生成器),同时隐变量分布又被近似编码为标准正态分布,因此VAE既是一个生成模型,又是一个特征提取器。在图像领域中,由于VAE生成的图片偏模糊,因此大家通常更关心VAE作为图像特征提取器的作用。提取特征都是为了下一步的任务准备的,而下一步的任务可能有很多,比如分类、聚 阅读全文
posted @ 2024-07-08 16:26 jasonzhangxianrong 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 话说我觉得我自己最近写文章都喜欢长篇大论了,而且扎堆地来~之前连续写了三篇关于Capsule的介绍,这次轮到VAE了,本文是VAE的第三篇探索,说不准还会有第四篇~不管怎么样,数量不重要,重要的是能把问题都想清楚。尤其是对于VAE这种新奇的建模思维来说,更加值得细细地抠。 这次我们要关心的一个问题是 阅读全文
posted @ 2024-07-08 16:25 jasonzhangxianrong 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 源起 # 前几天写了博文《变分自编码器(一):原来是这么一回事》,从一种比较通俗的观点来理解变分自编码器(VAE),在那篇文章的视角中,VAE跟普通的自编码器差别不大,无非是多加了噪声并对噪声做了约束。然而,当初我想要弄懂VAE的初衷,是想看看究竟贝叶斯学派的概率图模型究竟是如何与深度学习结合来发挥 阅读全文
posted @ 2024-07-08 00:19 jasonzhangxianrong 阅读(1) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 32 下一页