菜单

模型选择和指南

相关源文件

本文档提供了针对特定用例和工作流选择合适的 OpenAI 模型的实用指南。它涵盖了模型特性、决策框架、实现模式以及从原型到生产环境过渡的注意事项。

有关基本的 API 使用模式,请参阅核心 API 模式。有关特定模型的微调,请参阅微调。有关性能优化技术,请参阅性能和优化

模型特性和功能

OpenAI 提供了针对不同用例优化的独特模型系列。了解它们的核心优势和局限性对于有效的模型选择至关重要。

模型比较矩阵

模型核心优势理想用例主要局限升级路径
gpt-4.11M Token 文本准确性长文档分析,代码审查无法进行原生推理;成本更高预算紧张 → gpt-4.1-mini
gpt-4o实时语音/视觉聊天实时多模态代理文本 SOTA 略低于 4.1需要深度推理 → o4-mini
o3深度工具使用代理高风险、多步推理延迟和价格成本/延迟 → o4-mini
o4-mini经济、快速推理高吞吐量“足够好”的逻辑与 o3 相比的推理深度上限准确性至关重要 → o3

模型演进与专业化

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb37-75 images/2.2_model_evolution.png

模型选择决策框架

模型选择过程应考虑三个主要维度:任务复杂度、资源限制和准确性要求。

适应性决策树

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb1-31

按用例划分的实现模式

不同的用例展示了最佳的模型选择和编排模式。以下示例展示了如何为复杂工作流组合多个模型。

长上下文 RAG 模式

法律问答系统展示了用于文档处理的分层模型使用方式

模型使用模式

  • 路由: gpt-4.1-mini 用于通过自然语言理解进行块选择
  • 合成: gpt-4.1 用于生成带有结构化输出的答案
  • 验证: o4-mini 用于事实准确性验证

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb80-149 images/3A_rag_task_card.png

多智能体推理模式

制药研发协同科学家演示了复杂推理任务的模型编排

模型选择原理

  • 规划: o3 用于高推理工作量的深度多步推理
  • 研究: gpt-4.1 用于长上下文文献分析
  • 分析: o4-mini 用于快速数值处理
  • 验证: o3 用于关键安全评估

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb22-28 images/3B_reasoning_task_card.png images/3B_coscientist_architecture.png

视觉 + 推理模式

保险理赔处理系统结合了视觉能力和结构化推理

视觉模型选择

  • 标准表格: o4-mini 用于经济高效的视觉 + 推理
  • 复杂文档: gpt-4o 用于卓越的视觉理解
  • 关键决策: o3 用于带有审计跟踪的全面推理

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb22-28 images/3C_insurance_task_card.png images/3C_insurance_form.png

实现代码模式

分层路由实现

route_chunks() 函数展示了结构化模型交互

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb488-531

递归导航模式

navigate_to_paragraphs() 函数展示了深度控制的模型使用方式

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb611-678

生产过渡指南

模型性能监控

生产模型选择的关键指标

指标测量模型对比
延迟响应时间 (毫秒)o4-mini < gpt-4.1-mini < gpt-4.1 < o3
成本每次请求的 Token 数gpt-4.1-nano < gpt-4.1-mini < o4-mini < gpt-4.1 < o3
准确率任务特定指标o3 > gpt-4.1 > o4-mini > gpt-4.1-mini
推理深度多步能力o3 > o4-mini >> gpt-4.1 系列

原型到生产环境核对表

错误处理和回退

生产系统应实现模型回退策略

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb26-30

高级配置模式

推理工作量控制

o 系列模型支持动态推理工作量控制

上下文窗口优化

用于大文档处理,搭配 gpt-4.1

来源: examples/partners/model_selection_guide/model_selection_guide.ipynb338-420 examples/partners/model_selection_guide/model_selection_guide.ipynb55-61