摘要:
[TOC] 爬虫 1. 什么是爬虫 : 通过编写程序模拟浏览器上网,从互联网中爬取需要的数据的过程 2. 爬虫的分类 : 通用爬虫 : 爬取一整张页面源码数据.搜索引擎 (抓取系统→内部封好的一套爬虫程序) 重点使用的是该种形式爬虫 聚焦爬虫 : 抓取页面中指定的局部数据 增量式爬虫 : 监测网站数 阅读全文
摘要:
[TOC] 1. web框架 HTTP协议 发送HTTP请求 服务器接受请求并返回HTTP响应 在浏览器地址栏键入URL,按下回车之后经历的过程 HTTP请求方法 HTTP/1.1协议中共定义了八种方法(动作),来以不同方式操作指定的资源: HTTP状态码 所有HTTP响应的第一行都是状态行,依次是 阅读全文