摘要: 爬虫原理 模拟请求→拿到数据→根据数据不同的类型用不同的方式解析→存储 学习步骤 1、http协议 2、请求库:requests,(urlib3比较复杂,不建议) requests请求库只能把页面内容下载本地以后,并不能执行js代码(浏览器可以) 需要分析目标站点策略 3、解析库:re,beauti 阅读全文
posted @ 2017-11-06 21:38 铠甲巨人 阅读(207) 评论(0) 推荐(0) 编辑