2019 年 5月 20 日随笔档案 - 爬行的龟

2019年5月20日

摘要：模拟登陆知乎后，跳转到首页，返回400，请求无效，应该是知乎对request请求有做要求。看了下请求头，主要关注cookie、referer和user_agent（不要问为什么，我看视频的），cookie在scrapy.Request里有单独参数。不管怎样，先测试下：在Request里加上hea 阅读全文

posted @ 2019-05-20 22:24 爬行的龟阅读(974) 评论(0) 推荐(0) 编辑

如果手工启动chromedriver

摘要：使用selenium模拟登陆网站时，有些网站会识别chrome driver里的json信息，从而判断是不是爬虫程序，做到反爬效果。（比如知乎）下面说明下怎么手动启动chromedriver 1）、启动chrome 给开始菜单里的chrome或者桌面快捷方式，右键打开文件夹所在路径 2）打开dos 阅读全文

posted @ 2019-05-20 21:06 爬行的龟阅读(1465) 评论(0) 推荐(0) 编辑

爬行的龟

公告