摘要: 爬虫几步 - 准备url - 准备start_url - url地址规律不明显,总数不确定 - 通过代码提取下一页的url - xpath - 寻找url地址,部分参数在当前的响应中(比如,当前页码数和总的页码数在当前的响应中) - 准备url_list - 页码总数明确 - url地址规律明显 - 阅读全文
posted @ 2018-11-28 11:41 年轻人的魄力 阅读(190) 评论(0) 推荐(0) 编辑