2021年12月8日

摘要: 爬虫之模拟登录、自动获取cookie值、验证码识别 1、爬取网页分析 2、验证码识别 3、cookie自动获取 4、程序源代码 chaojiying.py sign in.py 1、爬取网页分析 爬取的目标网址为:https://www.gushiwen.cn/ 在登陆界面需要做的工作有,获取验证码 阅读全文
posted @ 2021-12-08 15:52 Skypeduty 阅读(1454) 评论(0) 推荐(0) 编辑
 
摘要: 一、利用requests.session进行登录状态保持 Requests模块中的session类能够自动处理发送请求获取响应过程中产生的cookie,进而达到状态保持的目的。 接下来我们通过requests.session登录GitHub网学习 1、requests.session的作用以及应用场 阅读全文
posted @ 2021-12-08 15:31 Skypeduty 阅读(3291) 评论(0) 推荐(0) 编辑