HTTP-报文结构
HTTP-报文结构
HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写。
默认HTTP的端口号为80,HTTPS的端口号为443。
HTTP协议是一个无状态的协议,同一个客户端的这次请求和上次请求是没有对应关系。
1、请求报文
一个HTTP请求由请求行、请求头、空行和请求数据4个部分组成。
1.1 请求行
由三部分组成,请求方法、请求URL(不包括域名)、HTTP协议版本。
1.1.1 请求方法
- GET:传递参数长度受限制,因为传递的参数是直接表示在地址栏中,而特定的浏览器和服务器对URL的长度是有限制的。因此GET请求不适合用来传递私密数据,也不太适合拿来传递大量数据
- POST:传递的数据封装在HTTP请求数据中,以名称/值的形式出现,可以传输大量数据,对数据量没有限制,也不会显示在URL中
- HEAD:跟GET相似,不过服务端收到HEAD请求时只返回响应头,不发送响应内容。所以,如果只需要查看某个页面的状态时,用HEAD更高效,因为省去了传输页面内容的时间
- DELETE:删除某一资源
- OPTIONS:用于获取当前URL所支持的方法。若请求成功,会在HTTP头中包含一个名为“Allow” 的头,值是所支持的方法,如“GET”、“POST”
- PUT:把一个资源存放在指定位置上。与POST相似,但PUT通常指定了资源的存放位置,而POST则没有
- TRACE:回显服务器收到的请求,主要用于测试或诊断
- CONNECT:是HTTP1.1预留的,能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接与非加密的HTTP代理服务器的通信
1.1.2 HTTP协议版本
1) HTTP 1.0
支持GET、POST、HEAD三种HTTP请求方法。
HTTP1.0 每次请求都需要建立新的TCP连接,连接不能复用。
2)HTTP1.1
该版本默认采用持久连接,并能很好地配合代理服务器工作。还支持以管道方式同时发送多个请求,以降低线路负载,提高传输速度。
HTTP1.1新增了:OPTIONS、PUT、DELETE、TRACE、CONNECT五种HTTP请求方法
1.2 请求头部
请求头部由关键字/值对组成,每行一对
- User-Agent : 产生请求的浏览器类型
- Accept : 客户端希望接受的数据类型,比如 Accept:text/xml(application/json)表示希望接受到的是xml(json)类型
- Content-Type:发送端发送的实体数据的数据类型。
比如,Content-Type:text/html(application/json)表示发送的是html类型。 - Host : 请求的主机名,允许多个域名同处一个IP地址,即虚拟主机
1.2.1 Content-Type
Content-Type | 解释 |
---|---|
text/html | html格式 |
text/plain | 纯文本格式 |
text/css | CSS格式 |
text/javascript | js格式 |
image/gif | gif图片格式 |
image/jpeg | jpg图片格式 |
image/png | png图片格式 |
application/x-www-form-urlencoded | POST专用:普通的表单提交默认是通过这种方式。form表单数据被编码为key/value格式发送到服务器。 |
application/json | POST专用:用来告诉服务端消息主体是序列化后的 JSON 字符串 |
text/xml | POST专用:发送xml数据 |
multipart/form-data | POST专用:下面讲解 |
multipart/form-data
用以支持向服务器发送二进制数据,以便可以在 POST 请求中实现文件上传等功能
1.3 空行
请求头之后是一个空行,通知服务器以下不再有请求头
1.4 请求体
GET没有请求数据,POST有。
与请求数据相关的最常使用的请求头是 Content-Type 和 Content-Length
2. 响应报文
HTTP响应报文和请求报文的结构差不多,也是由四个部分组成
2.1 状态行
HTTP响应报文同样也分为三部分,有状态行、首部行、实体
状态行:HTTP响应报文的第一行
状态行包括三个字段:协议版本、状态码与原因短语
状态码:由3位数字组成,第一个数字定义了响应的类别
1xx:这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。
2xx:这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。
3xx:这类状态码代表需要客户端采取进一步的操作才能完成请求。通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的Location域中指明。
4xx:这类的状态码代表客户端类的错误
5xx:服务器类的错误