本文档提供了 Deep-Live-Cam 中 GPU 加速的设置说明,以显著提高换脸性能。正确的 GPU 加速可以区分卡顿、延迟的处理和流畅的实时换脸。有关通用的安装说明,请参阅 安装指南 和 手动安装。
Deep-Live-Cam 支持多种硬件加速后端(称为“执行提供商”),以利用不同类型的 GPU 和处理单元。
根据您的硬件选择合适的执行提供商
| 硬件 | 操作系统 | 推荐提供商 | 预期性能 |
|---|---|---|---|
| NVIDIA GPU | 任意 | CUDA | 最佳 |
| AMD GPU | Windows | DirectML | 良好 |
| Apple M1/M2/M3 | macOS | CoreML (Silicon) | 非常好 |
| Intel Mac | macOS | CoreML (Legacy) | 中等 |
| Intel CPU/GPU | 任意 | OpenVINO | 中等 |
| 任何 CPU | 任意 | CPU (默认) | 差 |
下图显示了 GPU 加速如何集成到 Deep-Live-Cam 处理流程中。
来源:modules/processors/frame/core.py69-84 README.md311-330
使用 NVIDIA 显卡时,CUDA 为 Deep-Live-Cam 提供了最佳性能。
pip uninstall onnxruntime onnxruntime-gpu
pip install onnxruntime-gpu==1.16.3
python run.py --execution-provider cuda来源:README.md180-194 run-cuda.bat1-2
在 Windows 系统上,AMD GPU 推荐使用 DirectML。
pip uninstall onnxruntime onnxruntime-directml
pip install onnxruntime-directml==1.15.1
python run.py --execution-provider directml来源:README.md246-259 run-directml.bat1-2
为 Apple M1/M2/M3 芯片优化。
brew install python@3.10
brew install python-tk@3.10
python3.10 -m venv venv
source venv/bin/activate
pip uninstall onnxruntime onnxruntime-silicon
pip install onnxruntime-silicon==1.13.1
python3.10 run.py --execution-provider coreml
重要提示:您必须专门使用 Python 3.10,而不是更新的版本。
适用于基于 Intel 的 Mac 电脑。
pip uninstall onnxruntime onnxruntime-coreml
pip install onnxruntime-coreml==1.13.1
python run.py --execution-provider coreml
适用于 Intel CPU 和集成显卡。
pip uninstall onnxruntime onnxruntime-openvino
pip install onnxruntime-openvino==1.15.0
python run.py --execution-provider openvino
此图说明了 Deep-Live-Cam 如何加载和初始化执行提供商。
来源:modules/processors/frame/core.py19-41
Deep-Live-Cam 提供了一些命令行参数来微调 GPU 加速。
| 参数 | 描述 | 示例 |
|---|---|---|
--execution-provider | 指定要使用的硬件加速后端。 | --execution-provider cuda |
--execution-threads | 并行处理线程数。 | --execution-threads 4 |
--max-memory | 最大 RAM 使用量(GB)。 | --max-memory 8 |
使用示例
python run.py --execution-provider cuda --execution-threads 8 --max-memory 6
这些设置会根据您的特定硬件显著影响性能。
来源:README.md311-330 modules/processors/frame/core.py69-84
“提供商未找到”错误
GPU 加速性能不佳
macOS 特定问题
brew reinstall python-tk@3.10Windows 特定问题
GPU 加速带来的性能提升取决于您的硬件。以下是一般预期:
| 执行提供商 | FPS 提升 | 最佳用途 |
|---|---|---|
| CUDA (NVIDIA RTX) | 比 CPU 快 5-10 倍 | 实时网络摄像头、视频处理 |
| DirectML (AMD) | 比 CPU 快 3-7 倍 | 实时网络摄像头、视频处理 |
| CoreML (M1/M2) | 比 CPU 快 4-8 倍 | macOS 用户,实时应用 |
| OpenVINO | 比 CPU 快 2-4 倍 | 仅 Intel 系统 |
| CPU | 基线 | 测试,兼容性 |
请注意,实际性能会因具体硬件、分辨率和处理的人脸数量而异。
Deep-Live-Cam 模型已针对 GPU 加速进行了优化。必需的模型文件为:
inswapper_128_fp16.onnx - 换脸模型GFPGANv1.4.pth - 人脸增强模型在启用 GPU 加速运行应用程序之前,必须将这些模型放置在 `models` 目录中。