HTTP协议初步认识
1.基本概念:
HTML:HyperText Transfer Protocol,中文名:超文本传输协议,基于请求/响应模式,基于TCP/IP协议,是一种,无连接,无状态协议;
2.HTTP传输过程:
picture referer : https://www.cnblogs.com/Yang-Sen/p/9076804.html
3.HTTP协议内容:
HTTP协议包含请求协议和响应协议两部分:
- 请求协议:
请求行以一个方法GET或POST开头,以空格分开,后面跟着请求的URI和协议的版本。详细解释如下 GET /www.baidu.com/picture/index.html HTTP/1.1 Host: www.cnblogs.com //请求主机:www.cnblog.com Connection: keep-alive //连接类型:保持连接状态 Cache-Control: max-age=0 //缓存控制:最大缓存量=0,即不缓存 Upgrade-Insecure-Requests: 1 //更新请求安全等级:是,以后发请求的时候不用http而用https User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36 //客户端信息 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8 //支持的文件类型 Accept-Encoding: gzip, deflate //支持压缩文件类型 Accept-Language: zh-CN,zh;q=0.9 //支持的语言 请求行:第一行,用来说明请求类型,要访问的资源以及所使用的HTTP版本. GET说明请求类型为GET
www.baidu.com/picture/index.html 为要访问的资源 该行的最后一部分说明使用的是HTTP1.1版本
请求头:第二行开始,紧接着请求行(即第一行)之后,用来说明服务器要使用的附加信息 HOST将指出请求的目的地. User-Agent,服务器端和客户端脚本都能访问它,它是浏览器类型
检测逻辑的重要基础.该信息由你的浏览器来定义,并且在每个请求中自动发送等等
空行:请求头部后面的空行是必须的 即使第四部分的请求数据为空,也必须有空行。
请求体:可以添加任意的其他数据。 这个例子的请求数据为空。只有POST方法才有请求体,可以用浏览器登录一个网站,输错账号密码来抓取POST请求 POST / HTTP1.1 Host:www.wrox.com User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022) Content-Type:application/x-www-form-urlencoded Content-Length:40 Connection: Keep-Alive name=Professional%20Ajax&publisher=Wiley
- 响应协议:
下面是一条具体的响应:
4.常用响应头状态码
在http响应协议中,我们通过HttpWatch抓包抓取到响应信息。其中响应首行中就包含一个状态码。状态码由三位数字组成,表示请求是否被理解或者被满足。HTTP响应状态码的第一个数字定义了响应的类别,后面两位没有具体分类,第一个数字有五种可能的取值,具体介绍如下所示:
- 1xx :表示请求已接收,需要继续处理。
- 2xx :表示请求已经成功被服务器接收、理解、并接受
- 3xx :为完成请求,客户端需要进一步细化请求
- 4xx :客户端的请求有错误
- 5xx :服务器端出现错误
状态码 |
几条常见的状态码说明 |
200 |
请求成功,浏览器会把响应回来的信息显示在浏览器端。 |
404 |
表示客户端出错,比如说在浏览器端请求一个不存在的资源,这时浏览器端会出现404状态码。 |
405 |
客户端错误的一种,表示当前的请求方式不支持。比如说服务器端只对GET请求做了处理,而客户端的请求是post方式的,这个时候会出现405状态码。 |
500 |
服务器端错误,比如说服务器端代码出现空指针等异常,浏览器就会收到服务器发送的500状态码。 |
302 |
表示重定向。比如说浏览器访问一个资源,服务器响应给浏览器一个302的状态码,并且通过响应头Location发送了一个新的url,告诉浏览器去请求这个url。这就是重定向。 |
304 |
第一访问一个资源后,浏览器会将该资源缓存到本地,第二次再访问该资源时,如果该资源没有发生改变,那么服务器响应给浏览器304状态码,告诉浏览器使用本地缓存的资源。 |
5.常见请求方法
方法(操作) | 意义 |
---|---|
OPTIOON | 请求一些选项的信息, |
GET | 请求指定的页面信息,并返回实体主体。 |
HEAD | 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头。 |
POST |
向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。 |
PUT | 在指明的URL下存储一个文档 |
DELETE | 删除指明的URL所标记的资源 |
TRACE | 用来进行环回测试的请求报文,主要用于测试或诊断。 |
CONNECT | HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。 |