本文档提供了 ngosang/trackerslist 仓库中使用的黑名单机制和过滤过程的详细信息。黑名单系统确保跟踪器列表不包含重复、恶意跟踪器和其他有问题条目。
有关包含此过滤的总体更新机制的信息,请参阅 更新机制。
黑名单是维护跟踪器列表质量和可靠性的关键组成部分,通过以下方式实现:
来源:README.md28 blacklist.txt1-323
黑名单保存在一个纯文本文件中(blacklist.txt),格式简单。
tracker_url # reason_for_blacklisting
每个条目由一个跟踪器 URL 后面跟着一个解释该跟踪器被列入黑名单原因的注释组成。这种格式便于维护和更新黑名单。
https://tr.highstar.shop:443/announce # detected by antivirus software
http://bt-club.ws/announce # error
http://open.touki.ru/announce.php # malfunction
http://opentrackr.org:1337/announce # duplicate of http://tracker.opentrackr.org:1337/announce
黑名单包含多个被过滤掉的跟踪器类别:
| 类别 | 描述 | 示例 |
|---|---|---|
| 安全隐患 | 被杀毒软件标记的跟踪器 | https://tr.highstar.shop:443/announce |
| 错误(Errors) | 返回错误响应的跟踪器 | http://bt-club.ws/announce |
| 故障 | 工作不正常的跟踪器 | http://open.touki.ru/announce.php |
| 虚假种子 | 报告虚假 peer 信息的跟踪器 | http://bt.okmp3.ru:2710/announce |
| 管理员请求 | 被其管理员要求移除的跟踪器 | udp://tracker.breizh.pm:6969/announce |
| 需要注册 | 需要用户注册的跟踪器 | http://tracker2.postman.i2p/announce.php |
| 重复元素 | 指向与其他跟踪器相同域名或 IP 的跟踪器 | http://opentrackr.org:1337/announce |
过滤机制是跟踪器列表更新工作流程的组成部分。
来源:README.md27-28 blacklist.txt1-323
黑名单包含不同类型的条目,每种都有特定的目的。
用于过滤标记为具有安全隐患的跟踪器的条目
用于识别和过滤重复跟踪器的条目
黑名单通过以下方式进行维护:
当用户遇到跟踪器问题时,他们可以在 GitHub 仓库上打开 issue,以便对跟踪器进行调查并可能将其列入黑名单。
过滤过程直接影响跟踪器列表的构成。
| 列表类型 | 过滤的影响 |
|---|---|
| 最佳 Tracker | 经过最严格的过滤,以确保只包含最高质量的跟踪器 |
| 所有 Tracker | 经过过滤以移除有问题跟踪器,但仍保持全面的覆盖范围 |
| 协议专用列表 | 按每个协议类型进行过滤 |
| 基于 IP 的列表 | 附加过滤 Cloudflare IP |
基于 IP 的列表(trackers_all_ip.txt 和 trackers_best_ip.txt)通常比基于域名的列表短,因为它们应用了额外的过滤来移除 Cloudflare IP,如 README 中所述。
下图说明了黑名单如何与整个跟踪器列表更新系统集成。
来源:README.md27-32 blacklist.txt1-323
黑名单文件是一个简单的文本文件,每行一个条目。文件中的注释使用 # 字符来指示黑名单的原因。当自动化机器人处理跟踪器列表更新时,它会读取此文件来确定哪些跟踪器应从最终列表中排除。
下表显示了黑名单原因的模式及其频率(近似值)。
| 黑名单原因 | 大致数量 | 百分比 |
|---|---|---|
| 重复元素 | 160+ | ~50% |
| 已注册的种子 | 120+ | ~37% |
| 故障 | 10+ | ~3% |
| 安全隐患 | 5+ | ~2% |
| 管理员请求 | 5+ | ~2% |
| 其他 | 20+ | ~6% |