Python敏感地址扫描和爬取工具

为了方便信息安全测评工作，及时收集敏感地址(初衷是爬取api地址)，所以写了这么个小工具。两个简单的功能（目录扫描和url地址爬取）。

0×01 说明:

为了方便信息安全测评工作，及时收集敏感地址(初衷是爬取api地址)，所以写了这么个小工具。两个简单的功能（目录扫描和url地址爬取）。

python spider.py -u url -s api -o output.txt  -t thread_number #通过爬虫
python spider.py -u url -s dir -f dict.txt -o output.txt   #通过目录扫描

爬取规则：

第一个无法爬取页面注释中的地址（<!–http://example.com/index.html–>）,第二个无法爬取相对路径和php?id=等类型的地址，古结合两种规则，并排除图片视频类的地址，最后再去重

补全相对地址、防止越界（可爬取子域名，其他地址除外），并验证地址是否能正常访问

地址池

爬取功能，虽然使用了多线程，但还是比较慢，输出结果是爬取完毕的地址

目录扫描和输出到文件

更多Python视频、源码、资料加群683380553免费获取

posted @ 2022-10-07 20:56 I'm_江河湖海阅读(27) 评论(0) 收藏举报

刷新页面返回顶部