HTTP协议解析

一 HTTP协议

基于HTTP协议的client与server请求包含4个过程:
1.建立TCP套接字连接;
2.发送HTTP请求报文;
3.接收HTTP应答/响应报文;
4.关闭TCP套接字连接。

HTTP协议在TCP/IP协议栈的位置如下图所示:

 


由于HTTP报文是面向文本的,因此报文中的每一个字段都是一些ASCII码串,但各个字段的长度是不确定的。
HTTP有两类报文:请求报文和响应报文。

二 请求报文

HTTP请求报文格式如下:

(1)请求行
请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成,它们用空格分隔。
如:GET /index.html HTTP/1.1。
请求方法有以下几种:
GET     请求获取Request-URI所标识的资源
POST    在Request-URI所标识的资源后附加新的数据
HEAD    请求获取由Request-URI所标识的资源的响应消息报头
PUT     请求服务器存储一个资源,并用Request-URI作为其标识
DELETE  请求服务器删除Request-URI所标识的资源
TRACE   请求服务器回送收到的请求信息,主要用于测试或诊断
CONNECT 保留将来使用
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求
常用的为GET何POST方法

(2)请求头部
请求头部由key/value键值对组成,每行一对,关键字和值用英文冒号“:”分隔。请求头部通知服务器有关于客户端请求的信息,典型的请求头有:
User-Agent:产生请求的浏览器类型。
Accept:客户端可识别的内容类型列表。
Host: 请求的主机名,允许多个域名同处一个IP地址,即虚拟主机。

(3)空行
最后一个请求头之后是一个空行,发送回车符和换行符,通知服务器以下不再有请求头信息。


(4)请求数据
请求数据是在POST方法中使用。POST方法适用于需要客户填写表单的场合。与请求数据相关的最常使用的请求头是Content-Type和Content-Length。

 

三 响应报文

 

HTTP响应报文格式如下:



1)响应状态码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
常见状态代码、状态描述、说明:
200 OK      //客户端请求成功
400 Bad Request  //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用 
403 Forbidden  //服务器收到请求,但是拒绝提供服务
404 Not Found  //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable  //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
如:HTTP/1.1 200 OK (CRLF)

 

2)消息报头与请求报头类似,不同在于请求报头附带的是关于请求的相关信息,而消息报头则附带的是服务端应答的相关信息。更详细的内容可参考参考链接。

参考:

http://www.cnblogs.com/li0803/archive/2008/11/03/1324746.html

http://blog.csdn.net/gueter/article/details/1524447

posted on 2015-05-14 14:04  神奇的旋风  阅读(237)  评论(0编辑  收藏  举报

导航