这个作业属于哪个课程 | 至诚软工实践F班 |
---|---|
这个作业要求在哪里 | https://edu.cnblogs.com/campus/fzzcxy/ZhichengSoftengineeringPracticeFclass/homework/12532 |
这个作业的目标 | <学会fiddler抓包 并且利用编程软件将数据转化为JSON格式显示出来> |
Github 地址 | https://gitee.com/su-yue66/w212106740/blob/master/pupu.py |
学号 | <212106740> |
解题思路:
首先看到题目我是有点蒙圈的,因为从来没有接触过这类的软件,并且也从没有抓取过数据 就去百度查找相关的资料,因为目前接触过的软件有两个一个是java 一个是python 一开始看老师发布的云班课资料把fiddler环境配置好,后面找半天发现没有PC端朴朴 就问了同学 他们说用微信打开朴朴就行 然后我就开始按照步骤抓取朴朴的数据 一开始发现抓取了好多不知道是哪个 然后就一直找一直找 后面百度看了一下说先清空在点击 然后先别乱点 一般第一个就是 我试了一下 第一个确实是 然后按照老师给的步骤开始弄 发现找不到价格 后面查了半天 才发现 要去转成JSON格式 才会显示 然后就百度JSON 把爬来的数据放进去试试 后面看到了价格 还是比较激动的 在后面因为不知道怎么用软件把显示数据出来 就自己搞了半天一直报错 后面结合百度和舍友在旁边指导 代码是写出来了 但是发现 没办法导包requests 自己搞了好久一直百度 弄了很久 重装了好几次都没有好 百度试了好几个方法也没用 后面问了同学 他远程帮我调试了好久终于弄好了 后面我就自己运行 发现一直卡着 很久很久才弹出来报错 而且都跑到几百行了 试了好久 我后面把底下报错的去百度查取资料 发现要把代理服务区那个去除 不能打勾 否则模拟器访问不了 这个解决完 剩下就是一些小细节的问题 代码规范之类的 后面用gitee去创建库发现更简单一些 后面搞完之后 还是挺开心的 虽然有同学的帮助 但是自己也花了很大的功夫 多多少少也学会了一些东西 以后在遇到类似的事情 应该可以自己解决了 但是一开始是用的java数据是获取出来了 但是不会转换格式 百度查了好久都没有弄出来 后面就放弃了 就用python去完成这次的作业。
代码说明:
这是python的代码 因为python比较简洁 所以我感觉会更好用一些
这是抓取到的朴朴数据:
fiddler环境配置:
获取url地址数据:
python运行的结果:
解决模拟器拒绝访问:
如果这个勾选要把它点掉 否则会被拒绝访问
Git截图: