利用 Burp Suite + Python 实现“脱库”

 

此“脱库”非彼“脱库”、但相对来说也是同一类的、只是简单利用爬虫对网站内容进行批量提取、而非对后台数据库进行清洗、

 

操作步骤:

  一、首先利用Burp Suite来抓取手机APP的数据包、得到登陆的ip地址、

  二、再利用Python对题库进行爬取、

 

<1>先让手机和电脑处于同一个网段下、并且将手机无线代理电脑浏览器代理已经burp suite代理都设置好、

 

 

<2>然后利用burp suite对手机App进行抓包、得到该软件主页的ip地址、

 

<3>然后继续使用burp suite对网站题库进行抓包、获得必要参数用于编写python爬虫脚本、

 

<4>利用获得的数据编写爬虫脚本、并且根据需要适当修改参数、

 

#-*-coding:utf-8-*-

import requests         /*Requests 模块是使用 Apache2 Licensed 许可证的 HTTP 库*/
import re              /*Re 模块提供了与 Perl 相似l的正则表达式匹配操作对 Unicode 字符串也同样适用*/
import json             /*Json 模块用于将字符串形式的数据转化为字典、也可以逆向转换*/
import sys               /*Sys 模块提供了一系列有关 Python 运行环境的变量和函数*/

reload(sys)                  /*用于修改系统默认编码*/
sys.setdefaultencoding('utf-8')        /*将字节流str按给定的解码方式解码,并转换成utf-8形式*/

f=open("ku.txt","a")               /*打开ku.txt并写入内容*/
x=1                       /*生成题目序号*/
cookie={"PHPSESSID":"ckrgtur4g7nhrj5iknmpt36pt3"}     /*这里的cookie就是登陆时的、用来维持登陆状态*/
for i in range(6298,6499):                    /*这里是爬取的范围、i就是题目的nextid地址、可以根据需求进行修改*/
r=requests.get("http://106.14.52.88/index.php?m=api&c=question&a=article&groupid=232&id="+str(i)+"&n=0",cookies=cookie)    /*对题库网站进行GET请求*/
j = json.loads(r.text)          /*调用json库格式、获取源代码*/
title=j[u'question'][u'title']       /*爬取题目内容、并且将所得数据以中文形式输出*/
s=j[u'question'][u'answer']     /*爬取题目答案、并且将所得数据以中文形式输出*/
a=j[u'question'][u'a']         /*爬取题目A选项、并且将所得数据以中文形式输出*/
b=j[u'question'][u'b']         /*爬取题目B选项、并且将所得数据以中文形式输出*/
c=j[u'question'][u'c']         /*爬取题目C选项、并且将所得数据以中文形式输出*/
d=j[u'question'][u'd']         /*爬取题目D选项、并且将所得数据以中文形式输出*/

print title+"\n"+str(a)+"\n"+str(b)+"\n"+str(c)+"\n"+str(d)   /*打印爬取过程、格式:题目+选项*/

f.write("\n"+str(x)+"."+title+"\n"+"A:"+str(a)+"\n"+"B:"+str(b)+"\n"+"C:"+str(c)+"\n"+"D:"+str(d)+"\n"+"正确答案:"+str(s)+"\n") /*将爬取到的内容写入ku.txt中*/
x+=1          /*题目序号的自加、利用for循环遍历所需要的题库*/

 

<5>由于运行所需的requests模块需要自定义安装、所以不想在windows安装的也可以在kali里运行、

posted @ 2017-11-23 22:07  CTLers丶Vk  阅读(537)  评论(0)    收藏  举报