随笔分类 -  爬虫

摘要:ChromeDriver驱动版本:https://googlechromelabs.github.io/chrome-for-testing/ # 创建一个配置对象 options = webdriver.ChromeOptions() # 代理设置 options.add_argument('-- 阅读全文
posted @ 2024-09-10 17:36 愿风带走思绪 阅读(51) 评论(0) 推荐(0)
摘要:REGEX:(?insx)/[^\?/].(css|ico|jpg|png|gif|bmp|wav|js|jpeg)(\?.)?$ or .css .ico .jpg .png .gif .bmp .wav .js .jpeg 阅读全文
posted @ 2024-09-09 19:22 愿风带走思绪 阅读(160) 评论(0) 推荐(0)
摘要:// ==UserScript== // @name hook xxx // @namespace http://tampermonkey.net/ // @version 0.1 // @description try to take over the world! // @author You 阅读全文
posted @ 2024-09-06 19:12 愿风带走思绪 阅读(94) 评论(0) 推荐(0)
摘要:import requests from collections import Counter # 使用 Fiddler抓包工具获取请求头顺序 headers = { 'Host': 'match.yuanrenxue.cn', 'Connection': 'keep-alive', 'Pragma 阅读全文
posted @ 2024-09-06 15:58 愿风带走思绪 阅读(27) 评论(0) 推荐(0)
摘要:快代理 # proxiexUtils import requests def get_proxies_private(): """私密代理""" url = 'api地址' ip = requests.get(url).content.decode() proxies = { "http": f"h 阅读全文
posted @ 2024-09-04 15:04 愿风带走思绪 阅读(59) 评论(0) 推荐(0)