一个离开.NET的程序员

ryhan

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

HTTP请求模型
一、连接至Web服务器
一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。
例如:http://www.myweb.com:8080/index.html
Java中,这将等同于代码:

Socket socket=new Socket("www.myweb.com",8080);
InputStream in=socket.getInputStream();
OutputStream out=socket.getOutputStream();

二、发送HTTP请求
     通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据。一个请求由四个部分组成:请求行、请求头标、空行和请求数据。
1、请求行:请求行由三个标记组成:请求方法、请求URI和HTTP版本,它们用空格分隔。
例如:GET /index.html HTTP/1.1
HTTP规范定义了8种可能的请求方法:

  1. GET            //检索URI中标识资源的一个简单请求  
  2. HEAD            //与GET方法相同,服务器只返回状态行和头标,并不返回请求文档  
  3. POST            //服务器接受被写入客户端输出流中的数据的请求  
  4. PUT            //服务器保存请求数据作为指定URI新内容的请求  
  5. DELETE            //服务器删除URI中命名的资源的请求  
  6. OPTIONS        //关于服务器支持的请求方法信息的请求  
  7. TRACE            //Web服务器反馈Http 请求和其头标的请求  
  8. CONNECT        //已文档化但当前未实现的一个方法,预留做隧道处理 

2、请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。
请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:

  1. User-Agent  //客户端厂家和版本,eg:Mozilla /5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3  
  2. Accept  //客户端可识别的内容类型列表,eg:text /html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8  
  3. Accept-Language //接收语言,eg:zh- cn,zh;q=0.5  
  4. Accept-Encoding //接收压缩方式,eg:gzip,deflate  
  5. Accept-Charset //接收编码,eg:GB2312,utf-8  
  6. Keep-Alive //客户端到服务器端的连接持续有效  
  7. Connection //链接方式,eg:keep-alive  
  8. Cookie //  
  9. Cache-Control //控制HTTP缓存  
  10. Referer //请求的来源页面  
  11. Host //请求主机  
  12. Authorization //页面验证  
  13. //POST时  
  14. Content-Type //数据或文件的类型  
  15. Content-Length    //附加到请求的数据字节数 

3、空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。

4、请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。

三、服务端接受请求并返回HTTP响应
Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。
一个响应由四个部分组成;状态行、响应头标、空行、响应数据

1、状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
HTTP版本:向客户端指明其可理解的最高版本。
响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。
响应描述:为响应代码的可读性解释。
例如:HTTP/1.1 200 OK
HTTP响应码:

1xx:信息,请求收到,继续处理
2xx:成功,行为被成功地接受、理解和采纳
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误,请求包含语法错误或者请求无法实现
5xx:服务器错误,服务器不能完成对一种正常请求的处理

2、响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。

  1. Date    //返回时间,eg:Thu, 15 Oct 2009 15:44:12 GMT  
  2. Server //web服务器类型   Apache /2.0.54 (Unix)  
  3. Last-Modified //最近更新时间  Thu, 15 Oct 2009 15:43:22 GMT  
  4. Accept-Ranges //接收范围,eg:bytes  
  5. X-Powered-By //使用的语言工具,eg:PHP /5.2.6  
  6. Cache-Control //缓存控制,eg:max-age=60  
  7. Expires //过期时间  Thu, 15 Oct 2009 15:45:12 GMT  
  8. Content-Encoding //页面压缩 eg:gzip  
  9. Content-Type //返回数据类型,eg:   text/html; charset=UTF-8  
  10. Connection  //请求连接,eg:close
  11. Set-Cookie //The server sends the lineSet-Cookieonly if the server wishes the browser to store a cookie.Set-Cookieis a request for the browser to store the stringname=valueand send it back in all future requests to the server.

3、空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。

4、响应数据:HTML文档和图像等,也就是HTML本身。

四、服务器关闭连接,浏览器解析响应
1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。
2.然后解析每一个响应头标,头标告知以下为若干字节的HTML。
3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。
4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。

五、无状态连接
HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.
如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。



六、实例
1.浏览器发出请求
GET /index.html HTTP/1.1

服务器返回响应:

HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Content-Length: 119
Content-Type: text/html

<HTML>
<HEAD>
<LINK REL="stylesheet" HREF="index.css">
</HEAD>
<BODY>
<IMG SRC="image/logo.png">
</BODY>
</HTML>

附录知识:
1.HTTP规范:Internet工程制定组织(IETF)发布的RFC指定Internet标准,这些RFC被Internet研究发展机构广泛接受。因为它们是标准文档,故一般用正规语言编写,如立法文标一样。
2.RFC:RFC一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给出一个新的RFC。作为标准,RFC在Internet上被广泛采用。
3.HTTP的几个重要RFC:
    RFC1945    HTTP 1.0 描述
    RFC2068    HTTP 1.1 初步描述
    RFC2616    HTTP 1.1 标准
4.资源标识符URI(Uniform Resource Identifter,URI)
5.在http 1.0的协议里定义了三种请求方式:GET,POST,HEAD。http 1.1又补充了一些,如PUT,DELETE,OPTIONS和TRACE。
6.查看HTTP请求和相应的头信息:http://web-sniffer.net/  或者 firebug/httpwatch等工具。

参考资料:
http://www.java3z.com/cwbwebhome/article/article2/2406.html?id=1093
http://www.jgcao.com/index.php/2009/10/http-%E8%AF%B7%E6%B1%82%E7%AE%80%E4%BB%8B/
(http://www.51testing.com/index.php?uid-225738-action-viewspace-itemid-216200)

posted on 2011-08-09 17:13  ryhan  阅读(530)  评论(0编辑  收藏  举报