菜单

其他主要提取器

相关源文件

此页面介绍了 You-Get 中除主要的 YouTube 和 Bilibili 提取器(已包含在YouTube 提取器Bilibili 提取器中)之外的重要特定网站提取器。这些提取器处理具有独特身份验证方法、加密方案和内容分发系统的流行平台的媒体提取。

有关不支持的网站的备用机制信息,请参阅通用和嵌入式提取器

提取器架构概述

You-Get 中的所有特定网站提取器都遵循通用的架构模式,但实现了特定于网站的媒体提取逻辑。每个提取器通常继承自 VideoExtractor 基类,或实现具有标准方法的类似接口。

来源

爱奇艺提取器

爱奇艺提取器处理来自中国热门视频平台爱奇艺的视频。该提取器展示了处理加密视频 URL 和身份验证令牌的复杂技术。

爱奇艺提取器包括

  1. 流质量映射:将数值质量标识符映射到人类可读的描述

  2. 身份验证处理:使用时间戳和加密哈希生成身份验证令牌

  3. 自定义下载方法:覆盖默认下载方法,使用 FFmpeg 处理爱奇艺的媒体格式

来源

Twitter 提取器

Twitter 提取器处理来自 Twitter/X帖子的图片和视频。它展示了一种相对直接的基于 API 的内容提取方法。

主要实现细节

  1. URL 模式匹配:处理多种 URL 格式,包括移动端、时刻表和直接图片 URL

  2. API 集成:使用 Twitter 的 syndication API 来检索推文数据

  3. 媒体变体选择:按比特率对视频变体进行排序以选择最高质量的版本

来源

QQ 提取器

QQ 提取器功能多样,可处理腾讯生态系统中的多个平台,包括 QQ 视频、QQ 音乐和微信嵌入式视频。

独有功能

  1. 多平台支持:根据 URL 模式路由到专用处理程序

  2. 基于密钥的身份验证:生成身份验证密钥以安全访问 API

  3. 分片处理:管理多部分视频下载和合并

来源

AcFun 提取器

AcFun 是一个中国的视频平台,以动画、漫画和游戏内容而闻名。其提取器同时处理标准视频和剧集内容(番剧)。

值得关注的实现细节

  1. 质量定义:支持各种质量级别,包括高帧率选项

  2. JSON 提取:解析嵌入的 JSON 数据以提取视频信息

  3. 番剧支持:对剧集内容进行特殊处理

来源

Tumblr 提取器

Tumblr 提取器处理包含照片、GIF、视频以及其他平台嵌入内容的博文。

主要功能

  1. GDPR 同意处理:自动绕过 GDPR 同意页面

  2. 多内容类型支持:处理各种媒体类型,具有专门的提取方法

  3. 质量选择:识别并下载最高质量的版本

来源

百度提取器

百度提取器功能多样,可处理百度网盘(云存储)、百度音乐和贴吧论坛的内容。

实现亮点

  1. 密码保护处理:管理受保护的网盘分享

  2. 音乐元数据提取:检索歌曲详细信息和歌词

  3. 专辑处理:使用元数据组织多音轨专辑

来源

通用提取模式

尽管存在差异,主要提取器仍然遵循通用模式

模式描述示例
URL 解析使用正则表达式从不同 URL 格式中提取 IDTwitter, iQiyi, QQ
质量选择将质量 ID 映射到人类可读格式并选择最高可用质量AcFun, iQiyi
API集成向平台 API 发起身份验证调用Baidu, Twitter
M3U8 处理处理 HLS 流播放列表iQiyi, AcFun, QQ
自定义身份验证生成令牌、签名和时间戳iQiyi, Baidu Pan
自定义下载覆盖下载方法以满足特定平台的需求iQiyi, AcFun

来源

提取器注册和发现

所有提取器都注册在一个中央 SITES 字典中,该字典将域名映射到其相应的模块。当向 You-Get 提供 URL 时,系统会使用此字典来确定使用哪个提取器。

这种模块化设计使得

  1. 无需修改核心代码即可轻松添加新的提取器
  2. 尽管存在网站特定差异,但接口保持一致
  3. 为不受支持的网站优雅地回退到通用提取器

来源

  • 系统架构图已在引言中提供