Fork me on Gitee
摘要: 拉勾网反爬虫做的比较严,请求头多添加几个参数才能不被网站识别 找到真正的请求网址,返回的是一个json串,解析这个json串即可,而且注意是post传值 通过改变data中pn的值来控制翻页 job_name读取的结果是一个列表 ['JAVA高级工程师、爬虫工程师'] ,而我只想得到里面的字符串,在 阅读全文
posted @ 2018-08-12 21:36 MARK+ 阅读(966) 评论(0) 推荐(0) 编辑