技术实现

仓库架构

ML-For-Beginners 存储库围绕一个结构化的学习路径进行组织，该路径从基础概念到专业的机器学习技术。代码库通过几个相互关联的组件来实现此课程。

来源

存储库图表（如提示所示）
quiz-app/package.json
quiz-app/src/App.vue

代码实现

该存储库使用行业标准的框架和库，提供了 Python 和 R 中的机器学习概念的实现。

Python实现

Python 实现主要使用 scikit-learn 进行模型构建，并使用特定领域的专用库（NLP、时间序列等）。实现以 Jupyter notebook 的形式提供，以实现交互式学习。

R实现

R 实现利用了 tidyverse 生态系统，特别是 tidymodels 进行机器学习工作流。此实现展示了数据科学的“整洁”方法。

来源

示例工作流

以下是使用 tidymodels 在 R 中进行模型训练和评估的典型工作流

来源

测验应用程序

测验应用程序是一个基于 Vue.js 的 Web 应用程序，提供课前和课后测验，以测试知识的保留情况。

架构

来源

测验内容结构

每个测验都以 JSON 格式组织，包含

测验元数据（ID、标题）
问题集，包含
- 问题文本
- 多个答案选项
- 正确答案标记

来源

多语言支持

该课程提供广泛的多语言支持，以使内容在全球范围内可用。这是通过以下方式实现的：

课程的翻译 Markdown 文件（例如，README.fr.md）
JSON 格式的翻译测验内容
测验应用程序中的语言选择器

翻译架构

来源

quiz-app/src/App.vue5-14
quiz-app/src/assets/translations/index.js
存储库图表（如提示所示）

机器学习模型实现

该课程通过具体的代码实现涵盖了多种机器学习范式。以下是机器学习概念与其在代码库中实现的对应关系

机器学习范式	Python实现	R实现	主要库
回归	线性与逻辑回归	tidymodels 工作流	scikit-learn, tidymodels
分类	各种分类器	parsnip 模型	scikit-learn, nnet
聚类	K-means	stats::kmeans	scikit-learn, cluster
NLP	文本处理、情感分析	文本挖掘包	NLTK, tidytext
时间序列	ARIMA 模型	forecast 包	statsmodels, forecast
强化学习	Q-Learning	覆盖范围有限	gym, ReinforcementLearning

来源

2-Regression/4-Logistic/solution/R/lesson_4.Rmd
4-Classification/2-Classifiers-1/solution/R/lesson_11.Rmd
5-Clustering/2-K-Means/solution/R/lesson_15.Rmd
存储库图表（如提示所示）

R 模型实现示例

典型的 R 实现使用 tidymodels 创建一个结合了预处理和模型训练的工作流

# Define preprocessing recipe
recipe_obj <- recipe(target ~ ., data = training_data) %>%
  step_dummy(all_nominal(), -all_outcomes()) %>%
  step_normalize(all_predictors())

# Define model specification
model_spec <- logistic_reg() %>%
  set_engine("glm") %>%
  set_mode("classification")

# Create workflow
workflow_obj <- workflow() %>%
  add_recipe(recipe_obj) %>%
  add_model(model_spec)

# Train model
model_fit <- workflow_obj %>% 
  fit(data = training_data)

# Make predictions
predictions <- model_fit %>%
  predict(new_data = testing_data)

来源

基础设施组件

文档系统

课程以 Markdown 格式编写，结构一致

带解释的讲座内容
代码示例
练习和挑战
测验链接
其他资源参考

学习评估系统

来源

存储库图表（如提示所示）
2-Regression/4-Logistic/solution/R/lesson_4.Rmd16-17
quiz-app/src/assets/translations/fr.json

开发和部署架构

该存储库使用 GitHub Actions 进行自动化工作流，包括

文档生成
测验应用程序部署
持续集成测试

部署架构确保课程的更改能够自动反映在测验应用程序和文档中。

来源

存储库图表（如提示所示）
quiz-app/package.json5-9