此页面介绍了 You-Get 中除主要的 YouTube 和 Bilibili 提取器(已包含在YouTube 提取器和Bilibili 提取器中)之外的重要特定网站提取器。这些提取器处理具有独特身份验证方法、加密方案和内容分发系统的流行平台的媒体提取。
有关不支持的网站的备用机制信息,请参阅通用和嵌入式提取器。
You-Get 中的所有特定网站提取器都遵循通用的架构模式,但实现了特定于网站的媒体提取逻辑。每个提取器通常继承自 VideoExtractor 基类,或实现具有标准方法的类似接口。
来源
爱奇艺提取器处理来自中国热门视频平台爱奇艺的视频。该提取器展示了处理加密视频 URL 和身份验证令牌的复杂技术。
爱奇艺提取器包括
流质量映射:将数值质量标识符映射到人类可读的描述
身份验证处理:使用时间戳和加密哈希生成身份验证令牌
自定义下载方法:覆盖默认下载方法,使用 FFmpeg 处理爱奇艺的媒体格式
来源
Twitter 提取器处理来自 Twitter/X帖子的图片和视频。它展示了一种相对直接的基于 API 的内容提取方法。
主要实现细节
URL 模式匹配:处理多种 URL 格式,包括移动端、时刻表和直接图片 URL
API 集成:使用 Twitter 的 syndication API 来检索推文数据
媒体变体选择:按比特率对视频变体进行排序以选择最高质量的版本
来源
QQ 提取器功能多样,可处理腾讯生态系统中的多个平台,包括 QQ 视频、QQ 音乐和微信嵌入式视频。
独有功能
多平台支持:根据 URL 模式路由到专用处理程序
基于密钥的身份验证:生成身份验证密钥以安全访问 API
分片处理:管理多部分视频下载和合并
来源
AcFun 是一个中国的视频平台,以动画、漫画和游戏内容而闻名。其提取器同时处理标准视频和剧集内容(番剧)。
值得关注的实现细节
质量定义:支持各种质量级别,包括高帧率选项
JSON 提取:解析嵌入的 JSON 数据以提取视频信息
番剧支持:对剧集内容进行特殊处理
来源
Tumblr 提取器处理包含照片、GIF、视频以及其他平台嵌入内容的博文。
主要功能
GDPR 同意处理:自动绕过 GDPR 同意页面
多内容类型支持:处理各种媒体类型,具有专门的提取方法
质量选择:识别并下载最高质量的版本
来源
百度提取器功能多样,可处理百度网盘(云存储)、百度音乐和贴吧论坛的内容。
实现亮点
密码保护处理:管理受保护的网盘分享
音乐元数据提取:检索歌曲详细信息和歌词
专辑处理:使用元数据组织多音轨专辑
来源
尽管存在差异,主要提取器仍然遵循通用模式
| 模式 | 描述 | 示例 |
|---|---|---|
| URL 解析 | 使用正则表达式从不同 URL 格式中提取 ID | Twitter, iQiyi, QQ |
| 质量选择 | 将质量 ID 映射到人类可读格式并选择最高可用质量 | AcFun, iQiyi |
| API集成 | 向平台 API 发起身份验证调用 | Baidu, Twitter |
| M3U8 处理 | 处理 HLS 流播放列表 | iQiyi, AcFun, QQ |
| 自定义身份验证 | 生成令牌、签名和时间戳 | iQiyi, Baidu Pan |
| 自定义下载 | 覆盖下载方法以满足特定平台的需求 | iQiyi, AcFun |
来源
所有提取器都注册在一个中央 SITES 字典中,该字典将域名映射到其相应的模块。当向 You-Get 提供 URL 时,系统会使用此字典来确定使用哪个提取器。
这种模块化设计使得
来源