本文档解释了如何使用 Stable Diffusion 通过文本提示修改现有图像。与从头开始生成图像的文本到图像生成不同,图像到图像修改(img2img)以现有图像为起点,并根据文本指导进行转换。此功能支持各种应用,例如将草图转换为详细的艺术作品、更改艺术风格和图像放大。
来源: README.md169-173
Stable Diffusion 中的图像到图像修改基于 SDEdit 提出的扩散-去噪机制。该过程包括向现有图像添加噪声(由“强度”参数控制),然后根据文本提示进行去噪。
来源: README.md169-173
“强度”参数控制图像修改的程度
来源: README.md177-179
img2img.py 脚本在代码架构上与 txt2img.py 共享许多代码,关键区别在于初始潜在表示的生成方式。
来源: txt2img.py1-352
初始潜在表示:
采样过程:
参数:
--init-img 和 --strength来源: README.md169-190 txt2img.py98-248
基于 txt2img.py 的实现和 README 中的信息,img2img.py 可能接受以下关键参数
| 参数 | 描述 | 默认 |
|---|---|---|
--prompt | 指导图像修改的文本描述 | 必填 |
--init-img | 要修改的输入图像的路径 | 必填 |
--strength | 控制转换程度(0.0-1.0) | 必填 |
--outdir | 保存结果的目录 | "outputs/img2img-samples" |
--ddim_steps | 去噪步数 | 50 |
--scale | 无条件引导比例 | 7.5 |
--n_samples | 每个提示生成的样本数量 | 1 |
--seed | 用于可重现性的随机种子 | 根据请求属性(IP、URL 等)的哈希值进行路由 |
--ddim_eta | DDIM eta 参数 | 0.0 |
--plms | 使用 PLMS 采样而不是 DDIM | 否 |
--dpm_solver | 使用 DPM-Solver 采样 | 否 |
来源: README.md176-177 txt2img.py98-234
来源: txt2img.py245-348 README.md169-190
img2img 的主要用例之一是将简单的草图或图画转换为详细的艺术作品。README 通过一个将山脉草图转换为详细风景的例子进行了演示。
在 Pinta 等绘图程序中制作的粗略草图。
该脚本会生成多个输出图像版本,每个版本都保持草图中山脉的基本结构,但根据提示添加了细节、纹理和艺术风格。
来源: README.md174-189
img2img 的另一个应用是放大或增强模型先前生成的图像
来源: README.md190-191
强度参数调整:
提示工程:
输入图像准备:
来源: README.md177-190
Stable Diffusion 中的图像到图像修改功能为引导式图像编辑提供了强大的工具。通过平衡强度参数和精心制作适当的提示,用户可以实现从微妙的风格迁移到戏剧性的内容转换的各种效果。该过程基于与文本到图像生成相同的潜在扩散架构,但将其适应于处理现有的视觉内容。
刷新此 Wiki
最后索引时间2025 年 4 月 18 日(21f890)