stable diffusion （一）概述

前段时间看了台湾大学李宏毅教授关于diffusion模型的课程，记录一下

1、Framework

diffusion model包括3个部分，核心是generation model。

(1) Text encoder。可以用bert，chatgpt之类的来生成embedding，或者使用clip。这部分是提前训练好的

（2）Decoder。一个简单的encoder-decoder模型，可以直接拿图像来做训练，不需要标签。注意：这里的encoder只在训练的时候使用，生成阶段

不会使用。也是需要提前训练好。

（3）generation model。训练的时候先对图像进行encoder（2中训练好的encoder），得到latent represention，然后对latent represention循环的

加噪声，去训练模型的denoise能力，输出是预测的噪声。

posted @ 2023-04-03 09:07 牧马人夏峥阅读(190) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· deepstream学习（一）安装

· DAPR in Python

· Stable diffusion

· Stable Diffusion扩散模型

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

历史上的今天：
2016-04-03 CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？
2016-04-03 Morris Traversal方法遍历

昵称：牧马人夏峥
园龄： 10年3个月
粉丝： 69
关注： 76

2025年3月

日

一

二

三

四

五

六

牧马人夏峥