2018年12月11日

07.验证码处理,云打码平台

摘要: 引入 相关的门户网站在进行登录的时候,如果用户连续登录的次数超过3次或者5次的时候,就会在登录页中动态生成验证码。通过验证码达到分流和反爬的效果。 今日概要 使用云打码平台识别验证码 知识点回顾 session的创建方式 session的作用 proxies参数的作用 高匿,透明代理的区别 今日内容 阅读全文

posted @ 2018-12-11 19:02 liangliang123456 阅读(460) 评论(0) 推荐(0) 编辑

05.Python网络爬虫之三种数据解析方式,正则解析,xpath解析,bs4解析

摘要: 回顾requests实现数据爬取的流程 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指定数据解析。因为大多数情况下的需求,我们都会指定去使用聚焦爬虫,也就是爬取页面中指定部分的数据值,而不是整个页面的数据。因此,本次课程中会给大家详细介绍讲解三种聚焦爬虫中的数据解析方式。至此 阅读全文

posted @ 2018-12-11 13:37 liangliang123456 阅读(427) 评论(0) 推荐(0) 编辑

导航