Web内容发现是安全测试中的一个关键阶段,它涉及识别Web应用程序上未链接和隐藏的内容。本节记录了用于发现Web服务器上文件、目录和端点的字典和技术,这些内容可能无法通过直接浏览访问。这些资源使安全专业人员能够枚举Web服务器内容,从而可能揭示漏洞、敏感信息或额外的攻击向量。
有关子域枚举,请参阅DNS发现;有关API端点发现,请参阅API发现。
SecLists的Web内容发现部分提供了按目的、大小和目标技术组织的各种字典。这些字典旨在与Gobuster、Dirbuster、Burp Suite或其他内容发现工具结合使用,以识别Web应用程序上隐藏或未链接的资源。
来源:Discovery/Web-Content/README.md1-87 Discovery/Web-Content/common.txt1-5
Web内容发现部分中的字典旨在支持不同的扫描方法、目标环境和扫描持续时间。
来源:Discovery/Web-Content/README.md11-54 Discovery/Web-Content/combined_words.txt1-20 Discovery/Web-Content/combined_directories.txt1-20
| 字典 | 描述 | 目的 | 大小 |
|---|---|---|---|
| common.txt | 常见文件和目录名称的核心列表 | 通用发现 | 4,000+条目 |
| combined_words.txt | 来自多个来源的聚合字典 | 全面文件发现 | 220,000+条目 |
| combined_directories.txt | 全面目录路径 | 目录结构发现 | 40,000+条目 |
| big.txt | 扩展通用字典 | 广泛覆盖扫描 | 20,000+条目 |
| Logins.fuzz.txt | 认证相关端点 | 查找登录页面 | 90+条目 |
| quickhits.txt | 常见漏洞路径 | 快速识别问题 | 2,000+条目 |
来源:Discovery/Web-Content/README.md18-54 Discovery/Web-Content/common.txt1-10 Discovery/Web-Content/Logins.fuzz.txt1-10
RAFT(递归应用程序模糊测试器)字典按以下方式分类:
内容类型:
大小:
大小写敏感性:
这种组织方式允许安全测试人员根据其测试要求、时间限制和目标环境选择合适的字典。
来源:Discovery/Web-Content/README.md11-16 Discovery/Web-Content/raft-large-extensions.txt1-10 Discovery/Web-Content/raft-large-extensions-lowercase.txt1-10
字典包含多种Web内容类别
隐藏文件和目录:
.htaccess, .env, .git, .config).bash_history, .htpasswd).well-known/security.txt)管理界面:
admin/, administrator/, admincp/)cpanel/, dashboard/, manage/)常见Web应用程序组件:
wp-admin/, joomla/)includes/, modules/, templates/)backup/, backup.sql, *.bak)开发和调试资源:
test.php, phpinfo.php)dev/, staging/)logs/, error_log)静态资源:
images/, uploads/, files/)css/, js/, assets/)来源:Discovery/Web-Content/common.txt1-100 Discovery/Web-Content/quickhits.txt1-50
扩展名字典涵盖了广泛的文件类型
| 类别 | 示例 | 目的 |
|---|---|---|
| 服务器端脚本 | .php, .asp, .aspx, .jsp | 识别后端代码 |
| 数据文件 | .xml, .json, .sql, .csv | 查找暴露的数据源 |
| 配置 | .conf, .config, .ini | 发现配置文件 |
| 备份 | .bak, .old, .backup | 查找可能包含敏感数据的备份文件 |
| 档案 | .zip, .tar.gz, .rar | 识别可下载的压缩包 |
| 文档 | .pdf, .doc, .txt | 定位暴露的文档 |
来源:Discovery/Web-Content/raft-large-extensions.txt1-50 Discovery/Web-Content/raft-large-extensions-lowercase.txt1-50
Web内容发现字典旨在集成到更广泛的安全评估工作流程中,为漏洞发现奠定基础。
来源:Discovery/Web-Content/README.md1-87
SecLists存储库包含用于内容管理系统和Web应用程序框架的专用字典,其中包含针对这些平台的特定路径和资源。
来源:Discovery/Web-Content/CMS/README.md1-29 Discovery/Web-Content/CMS/Adobe-AEM_2021.txt1-20 Discovery/Web-Content/CMS/Oracle-EBS-wordlist.txt1-20
与Gobuster配合使用
gobuster dir -u https://target.com -w /path/to/SecLists/Discovery/Web-Content/common.txt
与ffuf配合使用
ffuf -u https://target.com/FUZZ -w /path/to/SecLists/Discovery/Web-Content/raft-medium-directories.txt
与Burp Suite Intruder配合使用
| 场景 | 推荐字典 |
|---|---|
| 快速扫描 | common.txt, quickhits.txt, raft-small-directories.txt |
| 标准评估 | combined_directories.txt, raft-medium-directories.txt, raft-medium-files.txt |
| 全面调查 | combined_words.txt, big.txt, raft-large-directories.txt, raft-large-files.txt |
| 已知CMS | 相关CMS特定字典(例如:WordPress, Adobe AEM) |
| API侧重 | Discovery/Web-Content/api/ 中的API字典 |
来源:Discovery/Web-Content/README.md1-87
Web内容字典,特别是组合列表,通过SecLists存储库中的字典更新系统进行维护。
来源:Discovery/Web-Content/README.md18-54
先广后精:从较小、更常见的字典开始,然后根据发现结果逐步使用更大、更专业的字典
优先使用不区分大小写的扫描:许多Web服务器不区分大小写,因此为提高效率,请从全小写字典开始
考虑文件扩展名:根据目标技术(PHP, ASP.NET等)使用合适的扩展名字典
结合DNS发现:与子域枚举DNS发现相结合,进行全面的攻击面映射
分析响应代码和大小:关注非标准HTTP响应(不只是200 OK)和异常的响应大小
跟进模式:如果发现命名约定或模式,创建自定义字典以探索类似资源
遵守速率限制:实施适当的时间和请求限制,以避免干扰目标服务
检查误报:手动验证发现的资源,确认其为合法发现
来源:Discovery/Web-Content/README.md1-87
SecLists的Web内容发现部分提供了全面的字典集合,用于识别不同平台和技术上的隐藏Web资源。这些字典为安全专业人员系统地枚举Web应用程序奠定了基础,揭示潜在的安全漏洞和攻击向量。
通过根据目标环境、测试要求和时间限制选择合适的字典,安全测试人员可以有效地发现未链接的内容、管理界面、备份文件以及其他可能隐藏的敏感资源。