摘要: requests库是python爬虫使用频率最高的库,在网络请求中发挥着重要的作用,这边文章浅析requests的API源码。 该库文件结构如图: 提供的核心接口在__init__文件中,如下: from . import utils from . import packages from .mod 阅读全文
posted @ 2019-12-07 23:06 pypypypy 阅读(782) 评论(0) 推荐(0) 编辑
摘要: requests请求,就是用python的requests模块模拟浏览器请求,返回html源码 模拟浏览器请求有两种,一种是不需要用户登录或者验证的请求,一种是需要用户登录或者验证的请求 一、不需要用户登录或者验证的请求 这种比较简单,直接利用requests模块发一个请求即可拿到html源码 #! 阅读全文
posted @ 2019-12-07 22:52 pypypypy 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 环境: 1.windows 10 2.Python 3.7 3.Scrapy 1.7.3 4.mysql 5.5.53 一、Scrapy 安装 1. Scrapy:是一套基于Twisted的一部处理框架,是纯Python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页 阅读全文
posted @ 2019-12-07 16:58 pypypypy 阅读(241) 评论(0) 推荐(0) 编辑