本文档解释了 Stable Diffusion Web UI 中用于生成图像的参数和控件。它涵盖了影响生成过程的具体输入控件、它们的效果以及它们与底层系统的关系。有关生成流程本身的信息,请参阅 图像生成流程。
Web UI 提供了一套全面的控件来指导图像生成过程。这些控件可分为几类:
来源
提示控件是指导 AI 生成图像最基本的方式。
| 控制 | 描述 | 对生成的影响 |
|---|---|---|
| 提示 | 描述图像中应出现内容的正面文本 | 指导模型包含特定元素 |
| 负面提示 | 描述图像中应避免的内容的文本 | 指导模型排除特定元素 |
| 风格 | 正面提示/负面提示的预设组合 | 将预定义的文本模式应用于您的提示 |
提示通过 CLIP 文本编码器进行处理,并用于条件化扩散过程。更长、更详细的提示倾向于产生与描述更一致的详细图像。
令牌计数器显示提示使用的令牌数量,这很重要,因为过长的提示可能会被截断。
来源
尺寸控件决定了生成图像的大小和数量。
| 控制 | 描述 | 范围 | 默认 |
|---|---|---|---|
| 宽度 | 生成图像的宽度(像素) | 64-2048,步长 8 | 512 |
| 高度 | 生成图像的高度(像素) | 64-2048,步长 8 | 512 |
| 批次数量 | 要处理的批次数 | 1+ | 1 |
| 批次大小 | 每批图像的数量。 | 1-8 | 1 |
尺寸参数直接影响
生成的总图像数 = 批次数量 × 每批图像数
来源
来源
采样控件决定了扩散过程的工作方式,影响图像质量和生成速度。
| 控制 | 描述 | 效果 |
|---|---|---|
| 采样方法 | 用于去噪的算法 | 不同的方法平衡了质量和速度 |
| 采样步数 | 去噪步数 | 较高的值通常会产生更好的质量,但需要更长时间 |
| CFG Scale(提示词引导强度) | 引导尺度(CFG Scale) | 较高的值使图像更符合提示,但可能不太自然(1-30) |
采样器的选择对图像生成有显著影响
采样器根据类型实现于不同的模块
来源
种子控件允许实现图像的可重复性和变体。
| 控制 | 描述 | 效果 |
|---|---|---|
| 种子 | 生成的初始随机种子 | 相同的种子 + 相同的参数 = 相同的图像 |
| 随机种子 | 生成一个新的随机种子 | 每次产生不同的图像 |
| 重用种子 | 重用上次生成的种子 | 允许迭代调整 |
| 变体种子 | 用于变体的次级种子 | 根据强度与主种子结合 |
| 变体强度 | 变体对结果的影响程度 | 0 = 无影响,1 = 完全变体效果 |
种子值决定了被去噪成图像的初始噪声模式。使用相同的种子和相同的参数可以产生相同的图像,从而使结果可重复。
来源
高分辨率修复(在 txt2img 标签中可作为折叠式列表访问)是一个两阶段生成过程,用于创建更高分辨率的图像。
| 控制 | 描述 | 效果 |
|---|---|---|
| 高分辨率修复 | 该功能的切换 | 启用/禁用第二遍生成 |
| 放大器 | 放大初始图像的方法 | 不同的放大器具有不同的质量/伪影 |
| 去噪强度 | 改变放大图像的程度 | 较低的值保留更多细节,较高的值改变更多(0-1) |
| 放大比例 | 图像的缩放因子 | 较高的值会生成更大的图像 |
| 调整宽度/高度到 | 替代缩放因子 | 指定确切的目标尺寸 |
| 高分辨率步数 | 第二遍的步数 | 0 表示使用与第一遍相同的步数 |
| 高分辨率检查点 | 第二遍可选的、不同的模型 | 可以使用专门的模型进行放大 |
| 高分辨率采样器 | 第二遍可选的、不同的采样器 | 一些采样器在细化细节方面效果更好 |
高分辨率修复的工作原理是:
来源
图像到图像模式使用输入图像作为起点,并根据提示对其进行修改。
| 控制 | 描述 | 效果 |
|---|---|---|
| 去噪强度 | 从输入图像偏离的程度 | 较低的值(接近 0)保留更多原始内容,较高的值(接近 1)允许更多更改 |
| 缩放模式 | 如何处理不同的尺寸 | 选项包括裁剪、缩放、填充等。 |
| 图像 CFG 尺度 | 在提示和图像条件之间取得平衡 | 较高的值可以保留更多原始图像结构 |
使用图像修复模式时
| 控制 | 描述 | 效果 |
|---|---|---|
| 蒙版模糊 | 模糊掩码边缘的程度 | 较高的值会在修改和未修改区域之间创建更平滑的过渡 |
| 图像修复填充 | 如何初始填充掩码区域 | 选项包括使用背景色、原始内容等填充 |
| 以全分辨率进行内容填充 | 是否在原始图像分辨率下执行图像修复 | 有助于保留未掩码区域的细节 |
| 图像修复填充 | 扩大掩码区域的范围 | 较高的值有助于将修复区域与周围环境融合 |
来源
覆盖设置下拉菜单允许在不影响全局配置的情况下,临时更改全局设置以进行特定生成。这些设置仅适用于当前生成会话。
常见的覆盖项包括:
来源
来源
下表总结了关键参数如何影响生成过程
| 参数 | 低值 | 高值 | 性能影响 |
|---|---|---|---|
| 步数 | 更快的生成,细节较少 | 更细节的图像,更慢的生成 | 对生成时间有线性影响 |
| CFG Scale(提示词引导强度) | 更具创意,提示遵循性较差 | 严格遵循提示,可能不自然 | 对性能影响最小 |
| 尺寸 | 更快,细节较少 | 更细节,更慢 | 对内存使用和时间有二次方影响 |
| 批大小 | 更少的内存使用 | 更多的内存使用 | 对内存使用有线性影响 |
| 去噪强度 | 保留更多输入图像 | 根据提示产生更多更改 | 对性能影响最小 |
来源
图像生成控件对内存使用有显著影响
当遇到内存不足错误时,请考虑首先减小图像尺寸或批次大小,因为这些对内存使用影响最大。
来源