利用 Burp Suite + Python 实现“脱库”
此“脱库”非彼“脱库”、但相对来说也是同一类的、只是简单利用爬虫对网站内容进行批量提取、而非对后台数据库进行清洗、
操作步骤:
一、首先利用Burp Suite来抓取手机APP的数据包、得到登陆的ip地址、
二、再利用Python对题库进行爬取、
<1>先让手机和电脑处于同一个网段下、并且将手机无线代理和电脑浏览器代理已经burp suite代理都设置好、




<2>然后利用burp suite对手机App进行抓包、得到该软件主页的ip地址、


<3>然后继续使用burp suite对网站题库进行抓包、获得必要参数用于编写python爬虫脚本、

<4>利用获得的数据编写爬虫脚本、并且根据需要适当修改参数、
#-*-coding:utf-8-*-
import requests /*Requests 模块是使用 Apache2 Licensed 许可证的 HTTP 库*/
import re /*Re 模块提供了与 Perl 相似l的正则表达式匹配操作对 Unicode 字符串也同样适用*/
import json /*Json 模块用于将字符串形式的数据转化为字典、也可以逆向转换*/
import sys /*Sys 模块提供了一系列有关 Python 运行环境的变量和函数*/
reload(sys) /*用于修改系统默认编码*/
sys.setdefaultencoding('utf-8') /*将字节流str按给定的解码方式解码,并转换成utf-8形式*/
f=open("ku.txt","a") /*打开ku.txt并写入内容*/
x=1 /*生成题目序号*/
cookie={"PHPSESSID":"ckrgtur4g7nhrj5iknmpt36pt3"} /*这里的cookie就是登陆时的、用来维持登陆状态*/
for i in range(6298,6499): /*这里是爬取的范围、i就是题目的nextid地址、可以根据需求进行修改*/
r=requests.get("http://106.14.52.88/index.php?m=api&c=question&a=article&groupid=232&id="+str(i)+"&n=0",cookies=cookie) /*对题库网站进行GET请求*/
j = json.loads(r.text) /*调用json库格式、获取源代码*/
title=j[u'question'][u'title'] /*爬取题目内容、并且将所得数据以中文形式输出*/
s=j[u'question'][u'answer'] /*爬取题目答案、并且将所得数据以中文形式输出*/
a=j[u'question'][u'a'] /*爬取题目A选项、并且将所得数据以中文形式输出*/
b=j[u'question'][u'b'] /*爬取题目B选项、并且将所得数据以中文形式输出*/
c=j[u'question'][u'c'] /*爬取题目C选项、并且将所得数据以中文形式输出*/
d=j[u'question'][u'd'] /*爬取题目D选项、并且将所得数据以中文形式输出*/
print title+"\n"+str(a)+"\n"+str(b)+"\n"+str(c)+"\n"+str(d) /*打印爬取过程、格式:题目+选项*/
f.write("\n"+str(x)+"."+title+"\n"+"A:"+str(a)+"\n"+"B:"+str(b)+"\n"+"C:"+str(c)+"\n"+"D:"+str(d)+"\n"+"正确答案:"+str(s)+"\n") /*将爬取到的内容写入ku.txt中*/
x+=1 /*题目序号的自加、利用for循环遍历所需要的题库*/
<5>由于运行所需的requests模块需要自定义安装、所以不想在windows安装的也可以在kali里运行、


浙公网安备 33010602011771号