会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
蓝色玛格丽特
博客园
首页
新随笔
联系
订阅
管理
2019年8月12日
爬虫入门
摘要: 实现爬虫的基础套路 第一步、准备url (1).准备start_url 特点:url地址规律不明显,总数不确定。 通过代码提取下一页url的技巧:xpath;寻找url地址,部分参数在当前的响应中(比如:当前页面数和总页码数在当前的响应中) (2).准备url_list 特点:页面总数明确,url地
阅读全文
posted @ 2019-08-12 15:11 root01_barry
阅读(312)
评论(0)
推荐(0)
编辑
公告