图像生成控制

图像生成控件概述

Web UI 提供了一套全面的控件来指导图像生成过程。这些控件可分为几类：

提示控件 - 用于指导图像内容的文本输入
尺寸控件 - 用于确定图像大小和批次参数的设置
采样控件 - 影响采样过程的参数
生成修饰符 - 用于修改生成过程的附加设置
模式特定控件 - 仅适用于 txt2img 或 img2img 模式的设置

控件流程图

来源

提示控件

提示控件是指导 AI 生成图像最基本的方式。

正面提示和负面提示

控制	描述	对生成的影响
提示	描述图像中应出现内容的正面文本	指导模型包含特定元素
负面提示	描述图像中应避免的内容的文本	指导模型排除特定元素
风格	正面提示/负面提示的预设组合	将预定义的文本模式应用于您的提示

提示通过 CLIP 文本编码器进行处理，并用于条件化扩散过程。更长、更详细的提示倾向于产生与描述更一致的详细图像。

令牌计数器显示提示使用的令牌数量，这很重要，因为过长的提示可能会被截断。

来源

尺寸控件

尺寸控件决定了生成图像的大小和数量。

控制	描述	范围	默认
宽度	生成图像的宽度（像素）	64-2048，步长 8	512
高度	生成图像的高度（像素）	64-2048，步长 8	512
批次数量	要处理的批次数	1+	1
批次大小	每批图像的数量。	1-8	1

尺寸参数直接影响

内存使用（尺寸越大，所需的 VRAM 越多）
生成时间（尺寸越大，批次数越多，生成时间越长）
图像质量（尺寸越大，可以生成更细节的图像）

生成的总图像数 = 批次数量 × 每批图像数

来源

参数到处理类的映射

来源

采样控件

采样控件决定了扩散过程的工作方式，影响图像质量和生成速度。

控制	描述	效果
采样方法	用于去噪的算法	不同的方法平衡了质量和速度
采样步数	去噪步数	较高的值通常会产生更好的质量，但需要更长时间
CFG Scale（提示词引导强度）	引导尺度（CFG Scale）	较高的值使图像更符合提示，但可能不太自然（1-30）

采样器效果

采样器的选择对图像生成有显著影响

Euler a - 快速且通用，一个不错的通用采样器
DPM++ 2M Karras - 通常能产生高质量的结果，适合细节丰富的图像
DDIM - 速度更快，但可能产生细节较少的图像
LCM - 非常快，但需要 LCM 训练的模型

采样器根据类型实现于不同的模块

K-diffusion 采样器：modules/sd_samplers_kdiffusion.py
Timesteps 采样器：modules/sd_samplers_timesteps.py
LCM 采样器：modules/sd_samplers_lcm.py

来源

种子控件

种子控件允许实现图像的可重复性和变体。

控制	描述	效果
种子	生成的初始随机种子	相同的种子 + 相同的参数 = 相同的图像
随机种子	生成一个新的随机种子	每次产生不同的图像
重用种子	重用上次生成的种子	允许迭代调整
变体种子	用于变体的次级种子	根据强度与主种子结合
变体强度	变体对结果的影响程度	0 = 无影响，1 = 完全变体效果

种子值决定了被去噪成图像的初始噪声模式。使用相同的种子和相同的参数可以产生相同的图像，从而使结果可重复。

来源

特定于文本到图像的控件

高分辨率修复

高分辨率修复（在 txt2img 标签中可作为折叠式列表访问）是一个两阶段生成过程，用于创建更高分辨率的图像。

控制	描述	效果
高分辨率修复	该功能的切换	启用/禁用第二遍生成
放大器	放大初始图像的方法	不同的放大器具有不同的质量/伪影
去噪强度	改变放大图像的程度	较低的值保留更多细节，较高的值改变更多（0-1）
放大比例	图像的缩放因子	较高的值会生成更大的图像
调整宽度/高度到	替代缩放因子	指定确切的目标尺寸
高分辨率步数	第二遍的步数	0 表示使用与第一遍相同的步数
高分辨率检查点	第二遍可选的、不同的模型	可以使用专门的模型进行放大
高分辨率采样器	第二遍可选的、不同的采样器	一些采样器在细化细节方面效果更好

高分辨率修复的工作原理是：

生成指定尺寸的初始图像
使用选定的放大器放大此图像
在放大的图像上执行第二遍扩散，并指定去噪强度

来源

特定于图像到图像的控件

图像到图像模式使用输入图像作为起点，并根据提示对其进行修改。

核心 Img2img 控件

控制	描述	效果
去噪强度	从输入图像偏离的程度	较低的值（接近 0）保留更多原始内容，较高的值（接近 1）允许更多更改
缩放模式	如何处理不同的尺寸	选项包括裁剪、缩放、填充等。
图像 CFG 尺度	在提示和图像条件之间取得平衡	较高的值可以保留更多原始图像结构

图像修复控件

使用图像修复模式时

控制	描述	效果
蒙版模糊	模糊掩码边缘的程度	较高的值会在修改和未修改区域之间创建更平滑的过渡
图像修复填充	如何初始填充掩码区域	选项包括使用背景色、原始内容等填充
以全分辨率进行内容填充	是否在原始图像分辨率下执行图像修复	有助于保留未掩码区域的细节
图像修复填充	扩大掩码区域的范围	较高的值有助于将修复区域与周围环境融合

来源

高级参数

覆盖设置

覆盖设置下拉菜单允许在不影响全局配置的情况下，临时更改全局设置以进行特定生成。这些设置仅适用于当前生成会话。

常见的覆盖项包括：

CLIP 跳过值
使用的 VAE
放大器选项
面部修复设置

来源

参数流经系统

控件如何流经代码库

来源

参数对生成的影响

下表总结了关键参数如何影响生成过程

参数	低值	高值	性能影响
步数	更快的生成，细节较少	更细节的图像，更慢的生成	对生成时间有线性影响
CFG Scale（提示词引导强度）	更具创意，提示遵循性较差	严格遵循提示，可能不自然	对性能影响最小
尺寸	更快，细节较少	更细节，更慢	对内存使用和时间有二次方影响
批大小	更少的内存使用	更多的内存使用	对内存使用有线性影响
去噪强度	保留更多输入图像	根据提示产生更多更改	对性能影响最小

来源

modules/processing.py136-227

关于内存使用的说明

图像生成控件对内存使用有显著影响

图像尺寸 - 内存使用量与尺寸的平方成正比（宽度和高度都翻倍大约需要 4 倍内存）
批次大小 - 内存使用量与批次大小成线性关系
采样器 - 某些采样器比其他采样器需要更多内存
模型大小 - 不同的基础模型有不同的内存要求

当遇到内存不足错误时，请考虑首先减小图像尺寸或批次大小，因为这些对内存使用影响最大。

来源

modules/processing.py136-227