本页介绍访问 DeepSeek-R1 系列模型的各种方法。它涵盖了官方托管解决方案、API 端点、模型存储库以及部署选项的简要介绍。有关本地部署的详细说明,请参阅本地部署。有关访问模型后如何有效提示模型的指南,请参阅提示指南。
DeepSeek-R1 模型系列可以通过多种渠道访问,每种渠道都适合不同的用例和技术要求。
来源:README.md157-162 README.md162-186
可以在官方聊天界面 chat.deepseek.com 访问 DeepSeek-R1 模型。
来源:README.md158 README.md198-254
Web界面使用文件上传和网络搜索功能的特定模板提示
文件上传模板:
[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}
网络搜索模板:
[webpage X begin]...[webpage X end] 格式返回[citation:X] 格式的引用DeepSeek-R1 模型可通过与 OpenAI 兼容的 API 在 platform.deepseek.com 访问。
<think>\n来源:README.md160 README.md186-197
所有 DeepSeek-R1 模型均可在 Hugging Face 的 deepseek-ai 组织下找到。
| 模型类型 | HF 存储库 | 参数 | 上下文长度 |
|---|---|---|---|
| DeepSeek-R1-Zero | deepseek-ai/DeepSeek-R1-Zero | 总共 671B / 激活 37B | 128K |
| DeepSeek-R1 | deepseek-ai/DeepSeek-R1 | 总共 671B / 激活 37B | 128K |
| DeepSeek-R1-Distill-Qwen-1.5B | deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B | 1.5B | - |
| DeepSeek-R1-Distill-Qwen-7B | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | 7B | - |
| DeepSeek-R1-Distill-Llama-8B | deepseek-ai/DeepSeek-R1-Distill-Llama-8B | 8B | - |
| DeepSeek-R1-Distill-Qwen-14B | deepseek-ai/DeepSeek-R1-Distill-Qwen-14B | 14B | - |
| DeepSeek-R1-Distill-Qwen-32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B | 32B | - |
| DeepSeek-R1-Distill-Llama-70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B | 70B | - |
来源:README.md65-97 README.md172-184
对于本地使用 DeepSeek-R1 模型,根据模型类型的不同有不同的方法
蒸馏模型可与标准框架一起使用
使用 vLLM
使用 SGLang
有关本地部署选项的详细说明,请参阅本地部署。
| 访问方式 | 适用场景 | 设置复杂性 | 资源要求 | 定制 |
|---|---|---|---|---|
| 网页界面 | 快速测试,随意使用 | 无(即用型) | 无(云托管) | 仅限于 UI 选项 |
| API 平台 | 生产应用程序,服务集成 | 低(API 密钥设置) | 无(云托管) | 通过 API 参数灵活配置 |
| Hugging Face | 研究,实验 | 中等 | 因模型而异 | 高度可定制 |
| 本地部署 | 自定义应用程序,隐私要求,离线使用 | 高 | 高(尤其是大型模型) | 最大的灵活性 |