利用 Burp Suite + Python 实现“脱库”

此“脱库”非彼“脱库”、但相对来说也是同一类的、只是简单利用爬虫对网站内容进行批量提取、而非对后台数据库进行清洗、

操作步骤：

　　一、首先利用Burp Suite来抓取手机APP的数据包、得到登陆的ip地址、

　　二、再利用Python对题库进行爬取、

<1>先让手机和电脑处于同一个网段下、并且将手机无线代理和电脑浏览器代理已经burp suite代理都设置好、

<2>然后利用burp suite对手机App进行抓包、得到该软件主页的ip地址、

<3>然后继续使用burp suite对网站题库进行抓包、获得必要参数用于编写python爬虫脚本、

<4>利用获得的数据编写爬虫脚本、并且根据需要适当修改参数、

#-*-coding:utf-8-*-

import requests　　　　　　　　 /*Requests 模块是使用 Apache2 Licensed 许可证的 HTTP 库*/
import re 　　　　　　　　　　　　 /*Re 模块提供了与 Perl 相似l的正则表达式匹配操作对 Unicode 字符串也同样适用*/
import json　　　　　　　　　　　　 /*Json 模块用于将字符串形式的数据转化为字典、也可以逆向转换*/
import sys　　　　　　　　　　　　　　 /*Sys 模块提供了一系列有关 Python 运行环境的变量和函数*/

reload(sys) 　　　　　　　　　　　　　　 /*用于修改系统默认编码*/
sys.setdefaultencoding('utf-8')　　　　　　　　/*将字节流str按给定的解码方式解码，并转换成utf-8形式*/

f=open("ku.txt","a")　　　　　　　　　　　　　　 /*打开ku.txt并写入内容*/
x=1　　　　　　　　　　　　　　　　　　　　　　 /*生成题目序号*/
cookie={"PHPSESSID":"ckrgtur4g7nhrj5iknmpt36pt3"}　　　　 /*这里的cookie就是登陆时的、用来维持登陆状态*/
for i in range(6298,6499): 　　　　　　　　　　　　　　　　　　 /*这里是爬取的范围、i就是题目的nextid地址、可以根据需求进行修改*/
r=requests.get("http://106.14.52.88/index.php?m=api&c=question&a=article&groupid=232&id="+str(i)+"&n=0",cookies=cookie)　　　　/*对题库网站进行GET请求*/
j = json.loads(r.text)　　　　　　 /*调用json库格式、获取源代码*/
title=j[u'question'][u'title']　　　　 /*爬取题目内容、并且将所得数据以中文形式输出*/
s=j[u'question'][u'answer']　　　　 /*爬取题目答案、并且将所得数据以中文形式输出*/
a=j[u'question'][u'a']　　　　　　 /*爬取题目A选项、并且将所得数据以中文形式输出*/
b=j[u'question'][u'b'] 　　　　　　 /*爬取题目B选项、并且将所得数据以中文形式输出*/
c=j[u'question'][u'c'] 　　　　　　 /*爬取题目C选项、并且将所得数据以中文形式输出*/
d=j[u'question'][u'd'] 　　　　　　 /*爬取题目D选项、并且将所得数据以中文形式输出*/

print title+"\n"+str(a)+"\n"+str(b)+"\n"+str(c)+"\n"+str(d) 　　/*打印爬取过程、格式：题目+选项*/

f.write("\n"+str(x)+"."+title+"\n"+"A:"+str(a)+"\n"+"B:"+str(b)+"\n"+"C:"+str(c)+"\n"+"D:"+str(d)+"\n"+"正确答案:"+str(s)+"\n") /*将爬取到的内容写入ku.txt中*/
x+=1　　　　　　　　　　/*题目序号的自加、利用for循环遍历所需要的题库*/

<5>由于运行所需的requests模块需要自定义安装、所以不想在windows安装的也可以在kali里运行、

posted @ 2017-11-23 22:07 CTLers丶Vk 阅读(537) 评论(0) 收藏举报

刷新页面返回顶部

CTLers丶Vk

利用 Burp Suite + Python 实现“脱库”

公告