摘要: 模拟登陆知乎后,跳转到首页,返回400,请求无效,应该是知乎对request请求有做要求。 看了下请求头,主要关注cookie、referer和user_agent(不要问为什么,我看视频的),cookie在scrapy.Request里有单独参数。不管怎样,先测试下: 在Request里加上hea 阅读全文
posted @ 2019-05-20 22:24 爬行的龟 阅读(962) 评论(0) 推荐(0) 编辑
摘要: 使用selenium模拟登陆网站时,有些网站会识别chrome driver里的json信息,从而判断是不是爬虫程序,做到反爬效果。(比如知乎) 下面说明下怎么手动启动chromedriver 1)、启动chrome 给开始菜单里的chrome或者桌面快捷方式,右键打开文件夹所在路径 2)打开dos 阅读全文
posted @ 2019-05-20 21:06 爬行的龟 阅读(1424) 评论(0) 推荐(0) 编辑
如有错误,欢迎指正 邮箱656521736@qq.com