菜单

图像生成控制

相关源文件

本文档解释了 Stable Diffusion Web UI 中用于生成图像的参数和控件。它涵盖了影响生成过程的具体输入控件、它们的效果以及它们与底层系统的关系。有关生成流程本身的信息,请参阅 图像生成流程

图像生成控件概述

Web UI 提供了一套全面的控件来指导图像生成过程。这些控件可分为几类:

  1. 提示控件 - 用于指导图像内容的文本输入
  2. 尺寸控件 - 用于确定图像大小和批次参数的设置
  3. 采样控件 - 影响采样过程的参数
  4. 生成修饰符 - 用于修改生成过程的附加设置
  5. 模式特定控件 - 仅适用于 txt2img 或 img2img 模式的设置

控件流程图

来源

提示控件

提示控件是指导 AI 生成图像最基本的方式。

正面提示和负面提示

控制描述对生成的影响
提示描述图像中应出现内容的正面文本指导模型包含特定元素
负面提示描述图像中应避免的内容的文本指导模型排除特定元素
风格正面提示/负面提示的预设组合将预定义的文本模式应用于您的提示

提示通过 CLIP 文本编码器进行处理,并用于条件化扩散过程。更长、更详细的提示倾向于产生与描述更一致的详细图像。

令牌计数器显示提示使用的令牌数量,这很重要,因为过长的提示可能会被截断。

来源

尺寸控件

尺寸控件决定了生成图像的大小和数量。

控制描述范围默认
宽度生成图像的宽度(像素)64-2048,步长 8512
高度生成图像的高度(像素)64-2048,步长 8512
批次数量要处理的批次数1+1
批次大小每批图像的数量。1-81

尺寸参数直接影响

  • 内存使用(尺寸越大,所需的 VRAM 越多)
  • 生成时间(尺寸越大,批次数越多,生成时间越长)
  • 图像质量(尺寸越大,可以生成更细节的图像)

生成的总图像数 = 批次数量 × 每批图像数

来源

参数到处理类的映射

来源

采样控件

采样控件决定了扩散过程的工作方式,影响图像质量和生成速度。

控制描述效果
采样方法用于去噪的算法不同的方法平衡了质量和速度
采样步数去噪步数较高的值通常会产生更好的质量,但需要更长时间
CFG Scale(提示词引导强度)引导尺度(CFG Scale)较高的值使图像更符合提示,但可能不太自然(1-30)

采样器效果

采样器的选择对图像生成有显著影响

  • Euler a - 快速且通用,一个不错的通用采样器
  • DPM++ 2M Karras - 通常能产生高质量的结果,适合细节丰富的图像
  • DDIM - 速度更快,但可能产生细节较少的图像
  • LCM - 非常快,但需要 LCM 训练的模型

采样器根据类型实现于不同的模块

来源

种子控件

种子控件允许实现图像的可重复性和变体。

控制描述效果
种子生成的初始随机种子相同的种子 + 相同的参数 = 相同的图像
随机种子生成一个新的随机种子每次产生不同的图像
重用种子重用上次生成的种子允许迭代调整
变体种子用于变体的次级种子根据强度与主种子结合
变体强度变体对结果的影响程度0 = 无影响,1 = 完全变体效果

种子值决定了被去噪成图像的初始噪声模式。使用相同的种子和相同的参数可以产生相同的图像,从而使结果可重复。

来源

特定于文本到图像的控件

高分辨率修复

高分辨率修复(在 txt2img 标签中可作为折叠式列表访问)是一个两阶段生成过程,用于创建更高分辨率的图像。

控制描述效果
高分辨率修复该功能的切换启用/禁用第二遍生成
放大器放大初始图像的方法不同的放大器具有不同的质量/伪影
去噪强度改变放大图像的程度较低的值保留更多细节,较高的值改变更多(0-1)
放大比例图像的缩放因子较高的值会生成更大的图像
调整宽度/高度到替代缩放因子指定确切的目标尺寸
高分辨率步数第二遍的步数0 表示使用与第一遍相同的步数
高分辨率检查点第二遍可选的、不同的模型可以使用专门的模型进行放大
高分辨率采样器第二遍可选的、不同的采样器一些采样器在细化细节方面效果更好

高分辨率修复的工作原理是:

  1. 生成指定尺寸的初始图像
  2. 使用选定的放大器放大此图像
  3. 在放大的图像上执行第二遍扩散,并指定去噪强度

来源

特定于图像到图像的控件

图像到图像模式使用输入图像作为起点,并根据提示对其进行修改。

核心 Img2img 控件

控制描述效果
去噪强度从输入图像偏离的程度较低的值(接近 0)保留更多原始内容,较高的值(接近 1)允许更多更改
缩放模式如何处理不同的尺寸选项包括裁剪、缩放、填充等。
图像 CFG 尺度在提示和图像条件之间取得平衡较高的值可以保留更多原始图像结构

图像修复控件

使用图像修复模式时

控制描述效果
蒙版模糊模糊掩码边缘的程度较高的值会在修改和未修改区域之间创建更平滑的过渡
图像修复填充如何初始填充掩码区域选项包括使用背景色、原始内容等填充
以全分辨率进行内容填充是否在原始图像分辨率下执行图像修复有助于保留未掩码区域的细节
图像修复填充扩大掩码区域的范围较高的值有助于将修复区域与周围环境融合

来源

高级参数

覆盖设置

覆盖设置下拉菜单允许在不影响全局配置的情况下,临时更改全局设置以进行特定生成。这些设置仅适用于当前生成会话。

常见的覆盖项包括:

  • CLIP 跳过值
  • 使用的 VAE
  • 放大器选项
  • 面部修复设置

来源

参数流经系统

控件如何流经代码库

来源

参数对生成的影响

下表总结了关键参数如何影响生成过程

参数低值高值性能影响
步数更快的生成,细节较少更细节的图像,更慢的生成对生成时间有线性影响
CFG Scale(提示词引导强度)更具创意,提示遵循性较差严格遵循提示,可能不自然对性能影响最小
尺寸更快,细节较少更细节,更慢对内存使用和时间有二次方影响
批大小更少的内存使用更多的内存使用对内存使用有线性影响
去噪强度保留更多输入图像根据提示产生更多更改对性能影响最小

来源

关于内存使用的说明

图像生成控件对内存使用有显著影响

  1. 图像尺寸 - 内存使用量与尺寸的平方成正比(宽度和高度都翻倍大约需要 4 倍内存)
  2. 批次大小 - 内存使用量与批次大小成线性关系
  3. 采样器 - 某些采样器比其他采样器需要更多内存
  4. 模型大小 - 不同的基础模型有不同的内存要求

当遇到内存不足错误时,请考虑首先减小图像尺寸或批次大小,因为这些对内存使用影响最大。

来源