使用扩散模型从文本生成图像

1代的DALLE使用VQ-VAE 的改进版，2代的DALLE2 通过使用扩散模型将图片的生成提升到了一个新的高度，但是由于其计算量很大而且没有开源，我们普通用户并没有办法使用，但是Stable Diffusion 的出现改变现状，可以让我们普通用户也可以直接使用，并且以前相对于 Disco Diffusion, Stable Diffusion 生成的图片更加实用；相对于 DALLE 2，Stable Diffusion 需要占用的资源更少，这样我们也可以在自己的电脑中使用它生成高质量的图片。

在这篇文章中，将展示如何使用抱脸的扩散包通过文本生成图像，还有就一个一个不好的消息，因为这个模型的出现google的colab可能又要增加一些限制了。

从 DALLE 到Stable Diffusion

我们前面的文章也介绍过 OpenAI 的 DALLE-2 模型还有他的开源实现，它可以让我们从文本中创建高质量的图像。

但是DALLE2是收费的用户只有一些免费的额度，如果免费额度使用完毕就需要付费了，所以我决定寻找替代方案，并偶然发现了 Hugging Face 的一条新闻，他们发布了一个扩散模型的包diffusers ，可以让我们直接使用。

完整文章：

https://avoid.overfit.cn/post/63424c507ff04285b4620ec4f7b198c7

posted @ 2022-09-04 12:37 deephub 阅读(468) 评论(0) 收藏举报

刷新页面返回顶部

deephub

overfit深度学习

使用扩散模型从文本生成图像

从 DALLE 到Stable Diffusion

公告