摘要: 网站分析 最近看到都在说升学e通网这个网站:https://www.ewt360.com/ 那么废话不多说,看看这个网站: 打开网站输入账号密码, 账号:12345678911 密码:123456 可以看到网站url跳转到:https://web.ewt360.com/register/#/logi 阅读全文
posted @ 2021-11-03 17:18 是四不是十 阅读(1235) 评论(0) 推荐(0) 编辑
摘要: 多线程爬虫 原理 利用CPU和IO可以同时执行的原理,让CPU不会干巴巴的等待IO的完成 #网站:还是豆瓣250 https://movie.douban.com/top250 import requests from lxml import etree import time from threa 阅读全文
posted @ 2021-10-13 21:33 是四不是十 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 单线程爬虫 目标网站:https://movie.douban.com/top250 豆瓣top250 代码: import codecs import requests from bs4 import BeautifulSoup import time DOWNLOAD_URL = 'https: 阅读全文
posted @ 2021-10-13 20:56 是四不是十 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 蘑菇街商品信息获取 目标网站:https://www.mogu.com/ 操作:搜索 搜索关键词:连衣裙 1、分析: 打开控制台,输入关键词,鼠标向下滑动有新请求发生,查看请求发现在?data中携带数据 查看与分析请求参数: 乍一看好像只有mw-uuid和mw-sign两个加密参数,不着急看看js代 阅读全文
posted @ 2021-10-12 15:56 是四不是十 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 1、安装docker curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 安装完可能会出现一些问题: 安装docker之后,测试hello-world镜像,终端卡在Unable to find image 'hello 阅读全文
posted @ 2021-04-16 23:28 是四不是十 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 网站:https://m.ctyun.cn/wap/main/auth/login?redirect=%2Fmy 账号:234555551@qq.com 密码:fffffffffff....666 抓包分析一下: 密码直接加在url后面进行请求,打个xhr断点看看堆栈 找一下堆栈,当然也能直接全局搜 阅读全文
posted @ 2021-04-13 00:13 是四不是十 阅读(1789) 评论(0) 推荐(0) 编辑
摘要: 网站:aHR0cDovL2p6c2MubW9odXJkLmdvdi5jbi9kYXRhL2NvbXBhbnk= 抓包分析:网站为ajax加载,返回值为一大串数据,大致判断为js将数据解密为数据,打个xhr断点看下 按惯例找一下堆栈,找到value的堆栈好像是一个,往上找 发现一个疑似加密点的地方,将 阅读全文
posted @ 2021-04-12 22:56 是四不是十 阅读(82) 评论(0) 推荐(0) 编辑
摘要: 网址:aHR0cHM6Ly93d3cuY2xzLmNuL3RlbGVncmFwaA== 首先进行网站抓包分析 加密函数:sign,页面是ajax加载。全局搜一下sign加密点 此处有15个结果,一个一个找能找到结果。此处我直接打一个xhr断点进行分析。然后直接断住了,查看一个堆栈。 搜一下sign, 阅读全文
posted @ 2021-04-11 22:24 是四不是十 阅读(1462) 评论(0) 推荐(0) 编辑
摘要: 昨天介绍了一个不用写代码的web项目,今天说一下数据的获取。 球员信息​网站:https://nba.hupu.com/players/ ​首先进行页面的分析: 此图片的url:https://nba.hupu.com/players/ 点击左边的球队url会根据球队的不同进行相应的变化: 因此,我 阅读全文
posted @ 2021-01-07 01:40 是四不是十 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 爬虫工程师进行数据获取后,往往都需要进行数据信息的展示,但是重新编写一个项目的成本太大。 因此我思考,能不能有一个直接可以根据需要的字段、进行直接的配置,而不用进行复杂的代码编写就能完成。 今天的主角 Diboot,完全满足这个需求。 话不多说:直接进行介绍 Diboot官网:https://www 阅读全文
posted @ 2021-01-05 21:47 是四不是十 阅读(1512) 评论(0) 推荐(0) 编辑