01 2023 档案
自己搭建代理池
摘要:参考 : https://cuiqingcai.com/7048.html ProxyPool 简易高效的代理池,提供如下功能: 定时抓取免费代理网站,简易可扩展。 使用 Redis 对代理进行存储并对代理可用性进行排序。 定时测试和筛选,剔除不可用代理,留下可用代理。 提供代理 API,随机取用测
阅读全文
一些库安装
摘要:seleniumwire from seleniumwire import webdriver参考 https://crifan.github.io/selenium_summary/website/plugin/selenium_wire.html from webdriver_manager.c
阅读全文
python 访问excel 、pdf链接 读取并处理 数据
摘要:python访问excel链接,读取内容 res_url = ‘https://dispozitive.anm.ro/f1f2-display’ res = requests.get(res_url, timeout=60) selector = etree.HTML(res.text) xls_l
阅读全文
Pycharm 配置镜像源
摘要:1. 国内主流Python第三方库安装Url地址: 阿里云镜像:http://mirrors.aliyun.com/pypi/simple/ 豆瓣镜像:http://pypi.douban.com/simple/ 清华大学:https://pypi.tuna.tsinghua.edu.cn/simp
阅读全文