摘要: 1.爬虫尺寸 小规模,数据量小,爬取速度不敏感,Requests库,爬取网页 中规模,数据规模较大,爬取速度敏感,Scrapy库,爬取网站大规模,搜索引擎,爬取速度关键,定制开发,爬取全网 2.引发问题:性能骚扰,法律风险,隐私泄露 3.爬虫限制 来源审查:判断User‐Agent进行限制检查来访H 阅读全文
posted @ 2018-02-26 17:36 WY~记录 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 1.更多信息http://www.python-requests.org 2.安装:Win平台: “以管理员身份运行”cmd,执行 pip install requests 3.requests库的七个主要方法: requests.request() 构造一个请求,支撑以下各方法的基础方法reque 阅读全文
posted @ 2018-02-26 16:41 WY~记录 阅读(1279) 评论(0) 推荐(0) 编辑