随笔档案「2021年10月13日」：web爬虫02-多线程爬虫 ... - 是四不是十

2021年10月13日

摘要：多线程爬虫原理利用CPU和IO可以同时执行的原理，让CPU不会干巴巴的等待IO的完成 #网站：还是豆瓣250 https://movie.douban.com/top250 import requests from lxml import etree import time from threa 阅读全文

posted @ 2021-10-13 21:33 是四不是十阅读(60) 评论(0) 推荐(0)

web爬虫01-单线程爬虫

摘要：单线程爬虫目标网站：https://movie.douban.com/top250 豆瓣top250 代码： import codecs import requests from bs4 import BeautifulSoup import time DOWNLOAD_URL = 'https: 阅读全文

posted @ 2021-10-13 20:56 是四不是十阅读(59) 评论(0) 推荐(0)

港股打新网js逆向-数据获取

摘要：网址：aHR0cHM6Ly93d3cubGlhbmdodWFpcG8uY29tLyMvbGlzdGVkX3N0b2NrX2xpc3Q= 1、网站进行简要分析打开开发者工具，抓包请求成功后，返回一长段的数据data，需要的数据应该就是对data进行解密了，现在开始找解密点 2、寻找解密点网页打上阅读全文

posted @ 2021-10-13 20:39 是四不是十阅读(931) 评论(0) 推荐(0)

是四不是十

公告