会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
努力爬行的小虫子
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2021年2月16日
模拟登录之豆瓣登录_维持会话
摘要: http/https协议特性:无状态。 没有请求到对应页面数据的原因: 发起的第二次基于个人主页页面请求的时候,服务器端并不知道该此请求是基于登录状态下的请求。 Cookie:用来让服务器端记录客户端的相关状态。 -手动处理:通过抓包工具获取cookie值,将该值封装到headers中。(不建议)
阅读全文
posted @ 2021-02-16 22:10 努力爬行的小虫子
阅读(340)
评论(0)
推荐(0)
编辑
模拟登录之验证码识别
摘要: 验证码识别 反爬机制:验证码,识别验证码图片中的数据,用于模拟登录操作 验证码识别的操作:推荐第三方自动识别——超级鹰等 实战一:古诗文网登录页面中的验证码。 使用打码平台识别验证码的编码流程: -将验证码图片进行本地下载 -调用平台提供的示例代码进行图片数据识别 1 import requests
阅读全文
posted @ 2021-02-16 14:48 努力爬行的小虫子
阅读(326)
评论(0)
推荐(0)
编辑