python爬虫之requests.exceptions.ProxyError: HTTPSConnectionPool(host='www.xxxx.com', port=443): Max retries exceeded with url: / (Caused by ProxyError('Cannot connect to proxy.', timeout('_ssl.c:1108: Th

在测试某api时，偶然的发现一个很奇怪的现象

如下：

报的啥错呢：

requests.exceptions.ProxyError: HTTPSConnectionPool(host='www.xxxx.com', port=443): Max retries exceeded with url: / (Caused by ProxyError('Cannot connect to proxy.', timeout('_ssl.c:1108: The handshake operation timed out')))

根据我的经验，看到后面的Max retries exceeded with..... 之类的我都大概知道啥原因，就是请求重试量太多了，可是此时此刻我就一段同步代码啊，后面没内容了，而且也只请求了一次，headers里的Connection也是close而非keep-alive，verfiy也设置的false，

这咋回事呢

我又把https改成http：

结果还是如上，卧槽，这啥情况，我就纳了闷了，网上有朋友说需要安装这个那个的啥库：

pip install cryptography

pip install pyOpenSSL

pip install certifi

装完之后并没有什么卵用

升级requests看看呢，升级完还是不行

我换用aiohttp和httpx，也还是不行

这就很骚了。

最后突然想起有个东西：

哎，卧槽，还真的可以，os.environ['NO_PROXY']设置为你的目标网址的域名即可。

如果要设置多个域名：

但是一定要是字符串型，不然会报错，源码：

我查了下这个os.environ，意思就是设置系统变量的，['NO_PROXY']的意思就是指定某个域名别用代理去处理，哎，卧槽，我没加代理啊，我那个requests.get参数都没有用proxies这个参数。突然我看到开了的窗口，有这么个东西：

fiddler，卧槽，就是它了，关闭fiddler之后确实可以正常处理了，这就很骚了。

但是不对啊，我之前测试的时候，为了对比实际请求和爬虫请求的差异，开上fiddler抓包来对比参数，不是可以的吗，为啥这里就是不行。

最后我发现了，fiddler版本问题，之前我重装了系统，然后网上随便找了个安装包装上我就不管了，也没测试有没有问题

终极解决方案

别用最新版的requests和urllib3，其实核心的问题主要是urllib3导致的，最新的urllib3有更严格ssl的校验，所以，用以下方案解决

pip uninstall requests urllib3  # 先卸载

pip install requests==2.27  urllib3==1.25.8 -i https://pypi.doubanio.com/simple  # 指定版本安装，不然默认会装最新版

　　

posted @ 2021-04-02 15:44 Eeyhan 阅读(24200) 评论(4) 编辑收藏举报

刷新页面返回顶部