本文档提供了针对特定用例和工作流选择合适的 OpenAI 模型的实用指南。它涵盖了模型特性、决策框架、实现模式以及从原型到生产环境过渡的注意事项。
有关基本的 API 使用模式,请参阅核心 API 模式。有关特定模型的微调,请参阅微调。有关性能优化技术,请参阅性能和优化。
OpenAI 提供了针对不同用例优化的独特模型系列。了解它们的核心优势和局限性对于有效的模型选择至关重要。
| 模型 | 核心优势 | 理想用例 | 主要局限 | 升级路径 |
|---|---|---|---|---|
gpt-4.1 | 1M Token 文本准确性 | 长文档分析,代码审查 | 无法进行原生推理;成本更高 | 预算紧张 → gpt-4.1-mini |
gpt-4o | 实时语音/视觉聊天 | 实时多模态代理 | 文本 SOTA 略低于 4.1 | 需要深度推理 → o4-mini |
o3 | 深度工具使用代理 | 高风险、多步推理 | 延迟和价格 | 成本/延迟 → o4-mini |
o4-mini | 经济、快速推理 | 高吞吐量“足够好”的逻辑 | 与 o3 相比的推理深度上限 | 准确性至关重要 → o3 |
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb37-75 images/2.2_model_evolution.png
模型选择过程应考虑三个主要维度:任务复杂度、资源限制和准确性要求。
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb1-31
不同的用例展示了最佳的模型选择和编排模式。以下示例展示了如何为复杂工作流组合多个模型。
法律问答系统展示了用于文档处理的分层模型使用方式
模型使用模式
gpt-4.1-mini 用于通过自然语言理解进行块选择gpt-4.1 用于生成带有结构化输出的答案o4-mini 用于事实准确性验证来源: examples/partners/model_selection_guide/model_selection_guide.ipynb80-149 images/3A_rag_task_card.png
制药研发协同科学家演示了复杂推理任务的模型编排
模型选择原理
o3 用于高推理工作量的深度多步推理gpt-4.1 用于长上下文文献分析o4-mini 用于快速数值处理o3 用于关键安全评估来源: examples/partners/model_selection_guide/model_selection_guide.ipynb22-28 images/3B_reasoning_task_card.png images/3B_coscientist_architecture.png
保险理赔处理系统结合了视觉能力和结构化推理
视觉模型选择
o4-mini 用于经济高效的视觉 + 推理gpt-4o 用于卓越的视觉理解o3 用于带有审计跟踪的全面推理来源: examples/partners/model_selection_guide/model_selection_guide.ipynb22-28 images/3C_insurance_task_card.png images/3C_insurance_form.png
route_chunks() 函数展示了结构化模型交互
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb488-531
navigate_to_paragraphs() 函数展示了深度控制的模型使用方式
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb611-678
生产模型选择的关键指标
| 指标 | 测量 | 模型对比 |
|---|---|---|
| 延迟 | 响应时间 (毫秒) | o4-mini < gpt-4.1-mini < gpt-4.1 < o3 |
| 成本 | 每次请求的 Token 数 | gpt-4.1-nano < gpt-4.1-mini < o4-mini < gpt-4.1 < o3 |
| 准确率 | 任务特定指标 | o3 > gpt-4.1 > o4-mini > gpt-4.1-mini |
| 推理深度 | 多步能力 | o3 > o4-mini >> gpt-4.1 系列 |
生产系统应实现模型回退策略
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb26-30
o 系列模型支持动态推理工作量控制
用于大文档处理,搭配 gpt-4.1
来源: examples/partners/model_selection_guide/model_selection_guide.ipynb338-420 examples/partners/model_selection_guide/model_selection_guide.ipynb55-61