随笔 - 934, 文章 - 0, 评论 - 249, 阅读 - 345万

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

Stable Diffusion 的 CFG Scale 参数

Posted on   蝈蝈俊  阅读(6105)  评论(0编辑  收藏  举报

在图像生成过程中,CFG Scale 参数是一个关键因素,它控制着文本提示对生成图像的影响程度。

简而言之CFG Scale :

  • 参数越大,生成的图像与文本提示的相关性越高,但可能会失真。
  • 数值越小,相关性则越低,越有可能偏离提示或输入图像,但质量越好。

在实际应用中,将其设置在 7 到 11 之间往往能获得最佳的低噪效果。

值得注意的是,较高的 CFG Scale 数值不仅能提高生成结果与提示的匹配度,还会增加结果图片的饱和度和对比度,使颜色更加平滑,但纹理较少。然而,当数值高于 20 时,生成效果可能会出现反向变化,导致效果变差。

受CFG Scale参数变化影响最大的是连接度高的提示词图, 这意味着图中的单词彼此密切相关。

例如,提示“A photorealistic painting of a cat sitting on a chair”(一只猫坐在椅子上的逼真绘画)的提示词图将具有高度的连接性,因为提示中的所有词都彼此密切相关。

CFG scale: 1

CFG Scale = 1:生成的图像是一幅非常有创意的画,一只猫坐在椅子上。 它根本不像提示,模糊,坐姿奇怪、椅子奇怪等。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 1, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 5

CFG Scale = 5:生成的图像有创意,且像提示。 猫坐在椅子上,尾巴有点奇怪, 颜色跟下面几个比,有点淡。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 5, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 7

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 10

CFG Scale = 10:生成的图像开始看起来像提示。 椅子靠背有点奇怪。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 10, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 15

CFG Scale = 15:生成的图像开始看起来像提示,不太可能有任何创意元素。 这只猫坐在逼真的房间里一张逼真的椅子上。

猫的耳朵、眼睛有点不匹配,过于突出了。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 15, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 20

CFG Scale = 20:生成的图片看起来和提示的很像,不太可能有什么创意元素。 猫坐在逼真的房间里一张逼真的椅子上,画面非常细腻。

由于噪声多,猫脸,背景会感觉颜色有点突出了。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 20, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 30

CFG Scale = 30: 生成的图完全变了风格。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 30, Seed: 1659328295, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG 音阶的最佳点是什么?

CFG 比例值介于 0 到 20 之间。一般来说,CFG 比例值介于 7 到 11 之间时会产生最佳的低噪效果。

以下是使用 CFG 的一些建议:

  • 从较低的 CFG 比例值开始并增加它,直到您对结果满意为止。
  • 对更复杂的提示使用更高的 CFG 比例值。
  • 对于您想要更有创意的提示,请使用较低的 CFG 比例值。
  • 尝试不同的 CFG 比例值,看看哪种最适合您。
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示
历史上的今天:
2016-05-11 go mobile 得生命周期事件
2010-05-11 ASPX页面如何加载GAC中的组件?
2010-05-11 Window 2008 R2 软件限制策略的默认调整,导致记录事件日志的权限不足
点击右上角即可分享
微信分享提示