导航

Stable Diffusion 的 CFG Scale 参数

Posted on 2023-05-11 22:15  蝈蝈俊  阅读(5555)  评论(0编辑  收藏  举报

在图像生成过程中,CFG Scale 参数是一个关键因素,它控制着文本提示对生成图像的影响程度。

简而言之CFG Scale :

  • 参数越大,生成的图像与文本提示的相关性越高,但可能会失真。
  • 数值越小,相关性则越低,越有可能偏离提示或输入图像,但质量越好。

在实际应用中,将其设置在 7 到 11 之间往往能获得最佳的低噪效果。

值得注意的是,较高的 CFG Scale 数值不仅能提高生成结果与提示的匹配度,还会增加结果图片的饱和度和对比度,使颜色更加平滑,但纹理较少。然而,当数值高于 20 时,生成效果可能会出现反向变化,导致效果变差。

受CFG Scale参数变化影响最大的是连接度高的提示词图, 这意味着图中的单词彼此密切相关。

例如,提示“A photorealistic painting of a cat sitting on a chair”(一只猫坐在椅子上的逼真绘画)的提示词图将具有高度的连接性,因为提示中的所有词都彼此密切相关。

CFG scale: 1

CFG Scale = 1:生成的图像是一幅非常有创意的画,一只猫坐在椅子上。 它根本不像提示,模糊,坐姿奇怪、椅子奇怪等。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 1, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 5

CFG Scale = 5:生成的图像有创意,且像提示。 猫坐在椅子上,尾巴有点奇怪, 颜色跟下面几个比,有点淡。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 5, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 7

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 10

CFG Scale = 10:生成的图像开始看起来像提示。 椅子靠背有点奇怪。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 10, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 15

CFG Scale = 15:生成的图像开始看起来像提示,不太可能有任何创意元素。 这只猫坐在逼真的房间里一张逼真的椅子上。

猫的耳朵、眼睛有点不匹配,过于突出了。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 15, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 20

CFG Scale = 20:生成的图片看起来和提示的很像,不太可能有什么创意元素。 猫坐在逼真的房间里一张逼真的椅子上,画面非常细腻。

由于噪声多,猫脸,背景会感觉颜色有点突出了。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 20, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 30

CFG Scale = 30: 生成的图完全变了风格。

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 30, Seed: 1659328295, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG 音阶的最佳点是什么?

CFG 比例值介于 0 到 20 之间。一般来说,CFG 比例值介于 7 到 11 之间时会产生最佳的低噪效果。

以下是使用 CFG 的一些建议:

  • 从较低的 CFG 比例值开始并增加它,直到您对结果满意为止。
  • 对更复杂的提示使用更高的 CFG 比例值。
  • 对于您想要更有创意的提示,请使用较低的 CFG 比例值。
  • 尝试不同的 CFG 比例值,看看哪种最适合您。