摘要: 实现爬虫的基础套路 第一步、准备url (1).准备start_url 特点:url地址规律不明显,总数不确定。 通过代码提取下一页url的技巧:xpath;寻找url地址,部分参数在当前的响应中(比如:当前页面数和总页码数在当前的响应中) (2).准备url_list 特点:页面总数明确,url地 阅读全文
posted @ 2019-08-12 15:11 root01_barry 阅读(312) 评论(0) 推荐(0) 编辑