LLM 基础提供了理解和使用大型语言模型所需的必要背景知识。这个可选部分涵盖了 LLM 的基本构建模块,包括数学、Python 编程、神经网络和自然语言处理概念。这些基础知识并非所有用户的起点,而是作为参考材料,支持 LLM 科学家 LLM 科学家 和 LLM 工程师 LLM 工程师。
来源: README.md12-16 README.md68-70
LLM 基础轨道建立的先备知识构成了更高级 LLM 主题的基础。本节旨在作为在学习科学家或工程师轨道时可按需查阅的参考材料。
来源: README.md68-76 README.md152-155
数学是机器学习算法和大型语言模型的理论基础。该知识领域涵盖了驱动模型训练和推理的关键数学概念。
来源: README.md77-94
Python 是实现机器学习算法和 LLM 的主要编程语言,它提供了一个丰富的库和工具生态系统,专门为数据科学和人工智能开发而设计。
| 库 | 在 LLM 开发中的主要用途 |
|---|---|
| NumPy | 矩阵运算和数值计算 |
| Pandas | 数据准备和操作 |
| PyTorch | 神经网络实现和训练 |
| Scikit-learn | 数据预处理和评估指标 |
| Matplotlib/Seaborn | 可视化模型性能和数据 |
来源: README.md97-113
神经网络是现代 LLM 的计算骨干,提供了学习数据复杂模式所需的架构。本节涵盖了理解神经网络功能及其实现方式所需的关键概念。
来源: README.md116-131
自然语言处理 (NLP) 弥合了人类语言与机器理解之间的差距。本节涵盖了核心 NLP 概念,这些概念构成了 LLM 处理和生成文本的基础。
来源: README.md134-151
LLM 基础部分为深入探索 LLM 科学和工程奠定了先备知识。推荐的学习路径如下所示,展示了这些基本概念如何构建到 LLM 开发生命周期中更高级的主题。
掌握基础知识后,学习者可以专攻
来源: README.md152-155 README.md68-151
该存储库为每个基础领域提供了精选的学习资源,融合了视频教程、交互式课程和参考材料。
| 领域 | 关键资源 |
|---|---|
| 数学 | 3Blue1Brown 视频、可汗学院课程、Immersive Linear Algebra |
| Python | Real Python 教程、freeCodeCamp 视频、Python Data Science Handbook |
| 神经网络 | 3Blue1Brown 讲解、Fast.ai 课程、PyTorch 教程 |
| NLP | Lena Voita 的课程、spaCy 教程、Kaggle 指南、Word2Vec 插图 |
有关具体的实现示例和实践学习,请参阅课程的 工具与资源 部分。
来源: README.md85-94 README.md107-113 README.md126-131 README.md144-151