HTTP协议简介
HTTP协议是超文本传输协议(HyperText Transfer Protocol),是一种用于分布式、协作式和超媒体信息系统的应用层协议。
主要特点
1、支持客户/服务器模式。
2、简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、POST、PUT、 DELETE。每种方法规定了客户与服务器联系的类型不同。 由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
3、灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
4、无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后, 即断开连接。采用这种方式可以节省传输时间。数据量、Keep-Alive 避免了重新建立连接(超过 Keep-Alive 规定的时间,意外断电等情况除外)
HTTP请求/响应步骤
1. 客户端连接到Web服务器。 一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80)建立一个TCP连接。例如,http://www.baidu.com。
2. 发送HTTP请求。 通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
3. 服务器接受请求并返回HTTP响应。Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。
4. 释放连接TCP连接。 若connection 模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求。
5. 客户端浏览器解析HTML内容。 客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
这里有个常见问题:当你在浏览器里面输入一个URL,回车后发生了什么事情?
(1)域名解析:浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
(2)解析出 IP 地址后,根据该 IP 地址和端口(默认端口 80)和服务器建立TCP连接;
(3)在第(2)步建立的连接上浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求;
(4)服务器对浏览器请求作出响应,响应结果发送给浏览器;
(5)释放 TCP连接;
(6)浏览器根据响应结果做页面渲染
HTTP请求方法
GET:向指定的资源发出“显示”请求。使用GET方法应该只用在读取数据。
HEAD:与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源。
PUT:向指定资源位置上传其最新内容。
DELETE:请求服务器删除Request-URI所标识的资源。
TRACE:回显服务器收到的请求,主要用于测试或诊断。
OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用'*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。
CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。
HTTP状态码
所有HTTP响应的第一行都是状态行,依次是当前HTTP版本号,3位数字组成的状态代码,以及描述状态的短语,彼此由空格分隔。
状态代码的第一个数字代表当前响应的类型:
- 1xx消息——请求已被服务器接收,继续处理
- 2xx成功——请求已成功被服务器接收、理解、并接受
- 3xx重定向——需要后续操作才能完成这一请求
- 4xx请求错误——请求含有词法错误或者无法被执行
- 5xx服务器错误——服务器在处理某个正确请求时发生错误
状态码
|
状态码英文名称
|
中文描述
|
100
|
Continue
|
|
101
|
Switching Protocols
|
切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,
例如,切换到HTTP的新版本协议
|
200
|
OK
|
请求成功。一般用于GET与POST请求
|
201
|
Created
|
已创建。成功请求并创建了新的资源
|
202
|
Accepted
|
已接受。已经接受请求,但未处理完成
|
203
|
Non-Authoritative Information
|
非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本
|
204
|
No Content
|
无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,
可确保浏览器继续显示当前文档
|
301
|
Moved Permanently
|
永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,
浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替
|
302
|
Found
|
临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI
|
303
|
See Other
|
查看其它地址。与301类似。使用GET和POST请求查看
|
304
|
Not Modified
|
未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,
通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源
|
305
|
Use Proxy
|
使用代理。所请求的资源必须通过代理访问
|
306
|
Unused
|
已经被废弃的HTTP状态码
|
400
|
Bad Request
|
客户端请求的语法错误,服务器无法理解
|
401
|
Unauthorized
|
请求要求用户的身份认证
|
403
|
Forbidden
|
服务器理解请求客户端的请求,但是拒绝执行此请求
|
404
|
Not Found
|
服务器无法根据客户端的请求找到资源(网页)。
通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面
|
405
|
Method Not Allowed
|
客户端请求中的方法被禁止
|
406
|
Not Acceptable
|
服务器无法根据客户端请求的内容特性完成请求
|
408
|
Request Time-out
|
服务器等待客户端发送的请求时间过长,超时
|
409
|
Conflict
|
服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突
|
500
|
Internal Server Error
|
服务器内部错误,无法完成请求
|
501
|
Not Implemented
|
服务器不支持请求的功能,无法完成请求
|
502
|
Bad Gateway
|
作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应
|
503
|
Service Unavailable
|
由于超载或系统维护,服务器暂时的无法处理客户端的请求。
延时的长度可包含在服务器的Retry-After头信息中
|
504
|
Gateway Time-out
|
充当网关或代理的服务器,未及时从远端服务器获取请求
|