摘要:
爬虫基础 1.爬虫:请求网站并请求数据的自动化程序。 2.爬虫的基本流程: 1.发起请求 通过http库向目标站点发起请求,即发送一个request,请求包含额外的headers信息,等待服务器响应。 2.解析内容 得到内容是HTML,可以用正则表达式、网页解析库进行解析。可能是json,可能是二进 阅读全文
摘要:
Requests库 Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的工作。( 阅读全文