随笔分类 - 爬虫相关
摘要:需求: 第一次访问金华房网(https://www.0579fw.com/)需要进行滑块校验,经过判断此验证码为阿里云验证码,但不同于12306、淘宝的验证码校验,现需要对网站滑块进行验证码破解并获取相应的cookie进行网站数据的采集,滑块样式如下: 1. 分析验证码来源 经过抓包分析验证码来源于
阅读全文
摘要:原因: selenium在运行会出现一些预定义的javascript变量(特征字符串),例如:"window.navgator,webdriver",在非selenium变量下的值为undefined,但是在selenium环境下,其职为true,不同的属性可以参考:https://blog.csd
阅读全文
摘要:1. 通过抓包工具发现,station.name.js这个js文件存储了所有的车站信息, 经过对请求头的分析,发现请求的url为:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.91
阅读全文