随笔分类 -  爬虫相关

摘要:需求: 第一次访问金华房网(https://www.0579fw.com/)需要进行滑块校验,经过判断此验证码为阿里云验证码,但不同于12306、淘宝的验证码校验,现需要对网站滑块进行验证码破解并获取相应的cookie进行网站数据的采集,滑块样式如下: 1. 分析验证码来源 经过抓包分析验证码来源于 阅读全文
posted @ 2022-05-18 19:06 Dog.泰迪 阅读(2344) 评论(0) 推荐(0) 编辑
摘要:原因: selenium在运行会出现一些预定义的javascript变量(特征字符串),例如:"window.navgator,webdriver",在非selenium变量下的值为undefined,但是在selenium环境下,其职为true,不同的属性可以参考:https://blog.csd 阅读全文
posted @ 2020-11-30 17:05 Dog.泰迪 阅读(398) 评论(0) 推荐(0) 编辑
摘要:1. 通过抓包工具发现,station.name.js这个js文件存储了所有的车站信息, 经过对请求头的分析,发现请求的url为:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.91 阅读全文
posted @ 2020-11-30 09:06 Dog.泰迪 阅读(646) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示