摘要: 多线程爬虫 原理 利用CPU和IO可以同时执行的原理,让CPU不会干巴巴的等待IO的完成 #网站:还是豆瓣250 https://movie.douban.com/top250 import requests from lxml import etree import time from threa 阅读全文
posted @ 2021-10-13 21:33 是四不是十 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 单线程爬虫 目标网站:https://movie.douban.com/top250 豆瓣top250 代码: import codecs import requests from bs4 import BeautifulSoup import time DOWNLOAD_URL = 'https: 阅读全文
posted @ 2021-10-13 20:56 是四不是十 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 网址:aHR0cHM6Ly93d3cubGlhbmdodWFpcG8uY29tLyMvbGlzdGVkX3N0b2NrX2xpc3Q= 1、网站进行简要分析 打开开发者工具,抓包 请求成功后,返回一长段的数据data,需要的数据应该就是对data进行解密了,现在开始找解密点 2、寻找解密点 网页打上 阅读全文
posted @ 2021-10-13 20:39 是四不是十 阅读(587) 评论(0) 推荐(0) 编辑