菜单

黑名单与过滤

相关源文件

本文档提供了 ngosang/trackerslist 仓库中使用的黑名单机制和过滤过程的详细信息。黑名单系统确保跟踪器列表不包含重复、恶意跟踪器和其他有问题条目。

有关包含此过滤的总体更新机制的信息,请参阅 更新机制

1. 黑名单的目的

黑名单是维护跟踪器列表质量和可靠性的关键组成部分,通过以下方式实现:

  • 移除重复的跟踪器(相同的域名或 IP 地址)
  • 过滤掉具有安全隐患的跟踪器
  • 排除需要注册的跟踪器
  • 移除故障跟踪器
  • 尊重跟踪器管理员的移除请求

来源:README.md28 blacklist.txt1-323

2. 黑名单结构

黑名单保存在一个纯文本文件中(blacklist.txt),格式简单。

tracker_url # reason_for_blacklisting

每个条目由一个跟踪器 URL 后面跟着一个解释该跟踪器被列入黑名单原因的注释组成。这种格式便于维护和更新黑名单。

2.1 示例条目

https://tr.highstar.shop:443/announce # detected by antivirus software
http://bt-club.ws/announce # error
http://open.touki.ru/announce.php # malfunction
http://opentrackr.org:1337/announce # duplicate of http://tracker.opentrackr.org:1337/announce

来源:blacklist.txt1-323

3. 过滤类别

黑名单包含多个被过滤掉的跟踪器类别:

类别描述示例
安全隐患被杀毒软件标记的跟踪器https://tr.highstar.shop:443/announce
错误(Errors)返回错误响应的跟踪器http://bt-club.ws/announce
故障工作不正常的跟踪器http://open.touki.ru/announce.php
虚假种子报告虚假 peer 信息的跟踪器http://bt.okmp3.ru:2710/announce
管理员请求被其管理员要求移除的跟踪器udp://tracker.breizh.pm:6969/announce
需要注册需要用户注册的跟踪器http://tracker2.postman.i2p/announce.php
重复元素指向与其他跟踪器相同域名或 IP 的跟踪器http://opentrackr.org:1337/announce

来源:blacklist.txt1-323

4. 过滤过程

过滤机制是跟踪器列表更新工作流程的组成部分。

来源:README.md27-28 blacklist.txt1-323

5. 黑名单条目类型

黑名单包含不同类型的条目,每种都有特定的目的。

5.1 安全过滤

用于过滤标记为具有安全隐患的跟踪器的条目

来源:blacklist.txt1-5

5.2 重复过滤

用于识别和过滤重复跟踪器的条目

来源:blacklist.txt163-322

6. 黑名单管理

黑名单通过以下方式进行维护:

  1. 自动化检测:系统根据域名或 IP 地址自动检测重复项
  2. 用户报告:用户可以通过 GitHub issue 报告有问题跟踪器
  3. 安全扫描:定期安全检查可识别潜在的恶意跟踪器
  4. 管理员请求:跟踪器管理员可以请求移除其跟踪器

当用户遇到跟踪器问题时,他们可以在 GitHub 仓库上打开 issue,以便对跟踪器进行调查并可能将其列入黑名单。

来源:README.md34-37

7. 对跟踪器列表的影响

过滤过程直接影响跟踪器列表的构成。

列表类型过滤的影响
最佳 Tracker经过最严格的过滤,以确保只包含最高质量的跟踪器
所有 Tracker经过过滤以移除有问题跟踪器,但仍保持全面的覆盖范围
协议专用列表按每个协议类型进行过滤
基于 IP 的列表附加过滤 Cloudflare IP

基于 IP 的列表(trackers_all_ip.txttrackers_best_ip.txt)通常比基于域名的列表短,因为它们应用了额外的过滤来移除 Cloudflare IP,如 README 中所述。

来源:README.md28-32

8. 系统集成

下图说明了黑名单如何与整个跟踪器列表更新系统集成。

来源:README.md27-32 blacklist.txt1-323

9. 技术实现

黑名单文件是一个简单的文本文件,每行一个条目。文件中的注释使用 # 字符来指示黑名单的原因。当自动化机器人处理跟踪器列表更新时,它会读取此文件来确定哪些跟踪器应从最终列表中排除。

黑名单模式分类示例

下表显示了黑名单原因的模式及其频率(近似值)。

黑名单原因大致数量百分比
重复元素160+~50%
已注册的种子120+~37%
故障10+~3%
安全隐患5+~2%
管理员请求5+~2%
其他20+~6%

来源:blacklist.txt1-323

10. 与其他系统组件的关系

来源:README.md12-24 README.md27-32 blacklist.txt1-323