如何假装你懂图片生成AI(Midjourney、文心一格)?
(“马爸爸开心回国图”,图片使用Midjourney生成)
(对了,如果有小伙伴还没有使用过ChatGPT,强烈建议大家亲身试用一下。我搭了一个免费的小跳板,可以直接访问ChatGPT,不需要魔法上网,有兴趣可以关注公众号“后厂村思维导图馆”(下面有二维码)向我索要))
最近和ChatGPT大语言模型一样大火的还有图片生成AI(Text-To-Image),大家耳熟能详的Midjourney、Stable Diffusion、Dalle2、Imagen等等都是图片生成AI,尤其是百度的文心一格上线后,网上的讨论(调侃)更加火热。
图片生成普遍采用Diffusion模型,这个模型的原理其实可以从米开朗琪罗的一句话中了解:
The sculpture is already complete within the marble block, before I start my work. It is already there, I just have to chisel away the superfluous material. - Michelangelo
“雕像本来就在大理石里,我只是把多余的部分去掉”,对于Diffusion模型来说,“图片本来就在那里,我只是把噪音去掉”。
这里尝试用一张思维导图,来梳理图片生成AI的基本信息,看过这张图,你对图片生成AI的理解,就已经超过99%的人了。
![]() |
关注作者:欢迎扫码关注公众号「后厂村思维导图馆」,获取本人自建的免费ChatGPT跳板地址,长期有效。 原文链接:https://www.cnblogs.com/morvenhuang/p/17283780.html 版权声明:本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须在文章页面给出原文链接,否则保留追究法律责任的权利。 |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!