模型访问

访问方法概述

DeepSeek-R1 模型系列可以通过多种渠道访问，每种渠道都适合不同的用例和技术要求。

模型访问选项图

来源：README.md157-162 README.md162-186

网页界面

可以在官方聊天界面 chat.deepseek.com 访问 DeepSeek-R1 模型。

主要功能

通过切换“DeepThink”按钮来启用推理能力
默认温度设置为 0.6
无需系统提示 - 所有指令都应包含在用户消息中
用于文件上传和网络搜索功能的特殊提示模板

Web界面使用流程

来源：README.md158 README.md198-254

文件上传和网络搜索模板

Web界面使用文件上传和网络搜索功能的特定模板提示

文件上传模板:

[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}

网络搜索模板:
- 提供中文和英文查询的模板
- 搜索结果以 [webpage X begin]...[webpage X end] 格式返回
- 响应中包含带 [citation:X] 格式的引用

来源：README.md198-254

API 平台

DeepSeek-R1 模型可通过与 OpenAI 兼容的 API 在 platform.deepseek.com 访问。

API集成流程

API 使用建议

使用与 OpenAI 兼容的端点格式
将温度设置在 0.5-0.7 的范围内（推荐 0.6）
避免使用系统提示 - 将所有指令包含在用户消息中
对于数学问题，请包含逐步推理指令
考虑在响应开头强制执行思维模式，使用 <think>\n

来源：README.md160 README.md186-197

Hugging Face 模型存储库

所有 DeepSeek-R1 模型均可在 Hugging Face 的 deepseek-ai 组织下找到。

模型类型	HF 存储库	参数	上下文长度
DeepSeek-R1-Zero	deepseek-ai/DeepSeek-R1-Zero	总共 671B / 激活 37B	128K
DeepSeek-R1	deepseek-ai/DeepSeek-R1	总共 671B / 激活 37B	128K
DeepSeek-R1-Distill-Qwen-1.5B	deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B	1.5B	-
DeepSeek-R1-Distill-Qwen-7B	deepseek-ai/DeepSeek-R1-Distill-Qwen-7B	7B	-
DeepSeek-R1-Distill-Llama-8B	deepseek-ai/DeepSeek-R1-Distill-Llama-8B	8B	-
DeepSeek-R1-Distill-Qwen-14B	deepseek-ai/DeepSeek-R1-Distill-Qwen-14B	14B	-
DeepSeek-R1-Distill-Qwen-32B	deepseek-ai/DeepSeek-R1-Distill-Qwen-32B	32B	-
DeepSeek-R1-Distill-Llama-70B	deepseek-ai/DeepSeek-R1-Distill-Llama-70B	70B	-

来源：README.md65-96

Hugging Face 模型访问

来源：README.md65-97 README.md172-184

本地部署概述

对于本地使用 DeepSeek-R1 模型，根据模型类型的不同有不同的方法

主要模型部署

DeepSeek-R1 和 DeepSeek-R1-Zero 需要 DeepSeek-V3 存储库
不直接受 Hugging Face Transformers 支持
请参阅 DeepSeek-V3 存储库以获取详细说明

蒸馏模型部署

蒸馏模型可与标准框架一起使用

使用 vLLM
使用 SGLang

有关本地部署选项的详细说明，请参阅本地部署。

来源：README.md165-184

访问方法比较

访问方式	适用场景	设置复杂性	资源要求	定制
网页界面	快速测试，随意使用	无（即用型）	无（云托管）	仅限于 UI 选项
API 平台	生产应用程序，服务集成	低（API 密钥设置）	无（云托管）	通过 API 参数灵活配置
Hugging Face	研究，实验	中等	因模型而异	高度可定制
本地部署	自定义应用程序，隐私要求，离线使用	高	高（尤其是大型模型）	最大的灵活性

来源：README.md157-186 README.md65-97