2018 年 6月 4 日随笔档案 - flowerszhao

2018年6月4日

摘要：爬虫基础 1.爬虫：请求网站并请求数据的自动化程序。 2.爬虫的基本流程： 1.发起请求通过http库向目标站点发起请求，即发送一个request，请求包含额外的headers信息，等待服务器响应。 2.解析内容得到内容是HTML，可以用正则表达式、网页解析库进行解析。可能是json,可能是二进阅读全文

posted @ 2018-06-04 11:51 flowerszhao 阅读(141) 评论(0) 推荐(0) 编辑

Requests库

摘要： Requests库 Requests是用python语言基于urllib编写的，采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用，你会发现，其实urllib还是非常不方便的，而Requests它会比urllib更加方便，可以节约我们大量的工作。（阅读全文

posted @ 2018-06-04 11:49 flowerszhao 阅读(338) 评论(0) 推荐(0) 编辑