本页面提供有关 DeepSeek-R1 仓库结构、组织、许可详细信息和贡献指南的详细信息。它作为理解代码库如何组织和管理的参考。有关模型本身的更多信息,请参阅 模型架构,有关用法详细信息,请参阅 模型用法。
DeepSeek-R1 仓库主要专注于提供对一系列推理专用语言模型的访问,包括文档、评估基准和部署说明。该仓库不包含实际的模型代码实现,而是通过 DeepSeek-V3 仓库引用了基础模型。
存储库结构图
来源: README.md1-29
该仓库包含以下主要组件:
| 组件 | 描述 | 目的 |
|---|---|---|
| README.md | 主要文档文件 | 提供模型、用法和基准的全面信息 |
| LICENSE | MIT 许可证文件 | 详细说明了存储库和模型的许可条款 |
| .github 目录 | GitHub 特定文件 | 包含存储库管理的工作流 |
| figures 目录 | 图像资源 | 包含基准可视化和其他图形 |
| DeepSeek_R1.pdf | 技术论文 | 提供有关模型架构和训练的深入技术细节 |
来源: README.md1-29
主要文档包含在 README.md 文件中,该文件组织成以下部分
此结构为用户提供了全面的指南,以了解、下载和使用 DeepSeek-R1 模型。
来源: README.md31-277
该仓库包含一个自动化系统,用于管理 GitHub 问题,以保持项目组织有序且响应迅速。
问题管理工作流图
来源: .github/workflows/stale.yml1-31
该仓库使用 GitHub 的 stale action 来自动管理不活动的 issue
此自动化有助于通过将注意力集中在活动的 issue 上来维护干净的 issue 跟踪器。
来源: .github/workflows/stale.yml12-30
DeepSeek-R1 仓库根据 MIT 许可证发布,该许可证提供了在使用、修改和分发方面的宽松权限。
许可证条款图
来源: LICENSE1-21 README.md256-261
MIT 许可证授予以下权限
唯一的要求是在软件的所有副本或实质性部分中包含原始版权声明和许可声明。
该许可证明确指出,该软件“按原样”提供,不提供任何形式的保证,并且作者或版权持有人不对任何索赔、损害或责任负责。
来源: LICENSE1-21
虽然仓库本身受 MIT 许可证保护,但一些蒸馏模型有不同的基础许可考虑因素
DeepSeek-R1-Distill-Qwen 模型(1.5B、7B、14B、32B)
DeepSeek-R1-Distill-Llama 模型:
所有模型均支持商业用途,并允许修改和衍生作品,包括用于训练其他 LLM 的蒸馏。
来源: README.md256-261
DeepSeek-R1 仓库的结构相对简单,目录很少
来源: README.md1-29
请注意,实际的模型代码和实现不包含在此仓库中。寻求在本地运行 DeepSeek-R1 模型的用户应参考 DeepSeek-V3 仓库以获取实现详细信息。