菜单

模型访问

相关源文件

本页介绍访问 DeepSeek-R1 系列模型的各种方法。它涵盖了官方托管解决方案、API 端点、模型存储库以及部署选项的简要介绍。有关本地部署的详细说明,请参阅本地部署。有关访问模型后如何有效提示模型的指南,请参阅提示指南

访问方法概述

DeepSeek-R1 模型系列可以通过多种渠道访问,每种渠道都适合不同的用例和技术要求。

模型访问选项图

来源:README.md157-162 README.md162-186

网页界面

可以在官方聊天界面 chat.deepseek.com 访问 DeepSeek-R1 模型。

主要功能

  • 通过切换“DeepThink”按钮来启用推理能力
  • 默认温度设置为 0.6
  • 无需系统提示 - 所有指令都应包含在用户消息中
  • 用于文件上传和网络搜索功能的特殊提示模板

Web界面使用流程

来源:README.md158 README.md198-254

文件上传和网络搜索模板

Web界面使用文件上传和网络搜索功能的特定模板提示

  1. 文件上传模板:

    [file name]: {file_name}
    [file content begin]
    {file_content}
    [file content end]
    {question}
    
  2. 网络搜索模板:

    • 提供中文和英文查询的模板
    • 搜索结果以 [webpage X begin]...[webpage X end] 格式返回
    • 响应中包含带 [citation:X] 格式的引用

来源:README.md198-254

API 平台

DeepSeek-R1 模型可通过与 OpenAI 兼容的 API 在 platform.deepseek.com 访问。

API集成流程

API 使用建议

  • 使用与 OpenAI 兼容的端点格式
  • 将温度设置在 0.5-0.7 的范围内(推荐 0.6)
  • 避免使用系统提示 - 将所有指令包含在用户消息中
  • 对于数学问题,请包含逐步推理指令
  • 考虑在响应开头强制执行思维模式,使用 <think>\n

来源:README.md160 README.md186-197

Hugging Face 模型存储库

所有 DeepSeek-R1 模型均可在 Hugging Face 的 deepseek-ai 组织下找到。

模型类型HF 存储库参数上下文长度
DeepSeek-R1-Zerodeepseek-ai/DeepSeek-R1-Zero总共 671B / 激活 37B128K
DeepSeek-R1deepseek-ai/DeepSeek-R1总共 671B / 激活 37B128K
DeepSeek-R1-Distill-Qwen-1.5Bdeepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B1.5B-
DeepSeek-R1-Distill-Qwen-7Bdeepseek-ai/DeepSeek-R1-Distill-Qwen-7B7B-
DeepSeek-R1-Distill-Llama-8Bdeepseek-ai/DeepSeek-R1-Distill-Llama-8B8B-
DeepSeek-R1-Distill-Qwen-14Bdeepseek-ai/DeepSeek-R1-Distill-Qwen-14B14B-
DeepSeek-R1-Distill-Qwen-32Bdeepseek-ai/DeepSeek-R1-Distill-Qwen-32B32B-
DeepSeek-R1-Distill-Llama-70Bdeepseek-ai/DeepSeek-R1-Distill-Llama-70B70B-

来源:README.md65-96

Hugging Face 模型访问

来源:README.md65-97 README.md172-184

本地部署概述

对于本地使用 DeepSeek-R1 模型,根据模型类型的不同有不同的方法

主要模型部署

  • DeepSeek-R1 和 DeepSeek-R1-Zero 需要 DeepSeek-V3 存储库
  • 不直接受 Hugging Face Transformers 支持
  • 请参阅 DeepSeek-V3 存储库以获取详细说明

蒸馏模型部署

蒸馏模型可与标准框架一起使用

  1. 使用 vLLM

  2. 使用 SGLang

有关本地部署选项的详细说明,请参阅本地部署

来源:README.md165-184

访问方法比较

访问方式适用场景设置复杂性资源要求定制
网页界面快速测试,随意使用无(即用型)无(云托管)仅限于 UI 选项
API 平台生产应用程序,服务集成低(API 密钥设置)无(云托管)通过 API 参数灵活配置
Hugging Face研究,实验中等因模型而异高度可定制
本地部署自定义应用程序,隐私要求,离线使用高(尤其是大型模型)最大的灵活性

来源:README.md157-186 README.md65-97