打赏
摘要: 一:Requests: 让 HTTP 服务人类 虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。 Requests 唯一的一个非转基因的 阅读全文
posted @ 2018-05-07 14:45 QueryMarsBo 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 一:HTTP和HTTPS HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法,以明文的形式传输,效率高,但是不安全 HTTPS(Hypertext Transfer Protocol over Secure Socket La 阅读全文
posted @ 2018-05-07 09:48 QueryMarsBo 阅读(1812) 评论(0) 推荐(0) 编辑
摘要: 一:通用爬虫和聚焦爬虫 根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 通用爬虫 通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 通用搜索引擎(Search Engine)工作 阅读全文
posted @ 2018-05-07 09:40 QueryMarsBo 阅读(2885) 评论(0) 推荐(0) 编辑