Asp.net探索系列(一)--[转载]客户端与服务器端交互原理

经常看到HTTP客户端与服务器端交互原理的各种版本的文章,但是专业术语太多,且流程过于复杂,不容易消化。于是就按照在 Servlet 里面的内容大致做了一些穿插。本来连 Tomcat 容器 和 Servlet 的生命周期也准备在这里一起写的,但怕过于庞大,于是就简单的引用了一些 Servlet 对象。这样的一个整个流程看下来,相信至少在理解 HTTP协议和 request 和 response 是如何完成从请求到生成响应结果回发的。在后续的一些文章里会专门讲一讲 Tomcat Servlet 是如何处理请求和完成响应的,更多的是说明Servlet 的生命周期。

 

HTTP介绍

1.HTTP是一种超文本传送协议(HyperText Transfer Protocol),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中,HTTP属于应用层协议,位于TCP/IP协议的顶层。

2.HTTP是一种无状态的协议,意思是指在Web 浏览器(客户端)和 Web 服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求(request),然后Web服务器返回一个响应(response),之后连接就关闭了,在服务端此时是没有保留连接的信息。

3.HTTP 遵循请求/响应(request/response)模型的,所有的通信交互都被构造在一套请求和响应模型中。

4.浏览Web时,浏览器通过HTTP协议与Web服务器交换信息,Web服务器向Web浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。

 

HTTP定义的事务处理由以下四步组成:

1.建立连接。

2.客户端发送HTTP请求头。

3.服务器端响应生成结果回发。

4.服务器端关闭连接,客户端解析回发响应头,恢复页面。

 

 

1.建立连接:以下用我的另一篇文章的地址做为例子

 

Servlet容器(Tomacat)介绍及配置

 

客户端,也就是我请求一个地址时,即打开了到 Web 服务器的HTTP端口的一个套接字。因为在网络中间作为传递数据的实体介质就是网线,数据实质上是通过IO流进行输出和输入,这就不难理解我们为什么在写一个Servlet的时候要引用 import java.io.*; 的原因,包括我们在向客户端回发结果的时候要用到 PrintWriter 对象的println()方法。

比如我在这里请求CSDN社区的一个地址http://blog.csdn.net,

实际上首先要请求这个地址,以及一个端口80(8080)http://blog.csdn.net:80    80可以不写,是因为浏览器网页服务默认的端口号是 80.

在Java底层代码中是这样实现的,只不过它们已经帮我们做了。

Socket socket=new Socket("blog.csdn.net",8080);

InputStream in=socket.getInputStream();

OutputStream out=socket.getOutputStream();

 

2.客户端发送HTTP请求头

 

一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令,是一个ASCII文本请求行,后跟0个或多个HTTP头标,一个空行和实现请求的任意数据。四个部分:请求行,请求头标,空行和请求数据。

1)请求行由三个标记组成:请求方法 请求URL HTTP版本,中间用空格分开

例如:GET lvpin/archive/2007/06/09/1645767.aspx HTTP/1.1

HTTP规范定义了8种可能的请求方法:(最常见的就是 GET 和 POST 两种方法)

GET     检索URI中标识资源的一个简单请求

HEAD    与GET方法相同,服务器只返回状态行和头标,并不返回请求文档

POST    服务器接受被写入客户端输出流中的数据的请求

PUT     服务器保存请求数据作为指定URI新内容的请求

DELETE 服务器删除URI中命名的资源的请求

OPTIONS 关于服务器支持的请求方法信息的请求

TRACE  Web服务器反馈Http请求和其头标的请求

CONNECT 已文档化但当前未实现的一个方法,预留做隧道处理

 

2)请求头标:由key :value 键值组成,每行一对。请求头标通知服务器有关客户端的功能和标识。

HOST            请求的哪一个服务器端地址,主地址 ,比如 我现在所在的CSDN blog.csdn.net/

 

User-Agent      用户即客户端可以使用的浏览器 ,如 : Mozilla/4.0

 

Accept       即客户端可以接受的MIME 类型列表,如image/gif   text/html application/msword

 

Content-Length 只适用于POST请求,以字节给出POST数据的尺寸

 

3)空行 发送回车符和退行,通知服务器以下不再有头标。

 

4)请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。

 

总结以上 我们可以这样写出一个标准的 HTTP请求

POST /lvpin/archive/2007/06/09/1645767.aspx HTTP1.1

HOST: blog.csdn.net/

User-Agent :Mozilla/4.0

Accpt: image/gif,text/html,application/pdf,image/png...

key=value&key=value&key=value.....................................(POST()请求的数据)

 

那么,这上面的一个例子说明的就是

 

我要去访问的服务器端的地址是blog.csdn.net/ 它下面的资源 /lvpin/archive/2007/06/09/1645767.aspx连起来就是    http://blog.csdn.net/lvpin/archive/2007/06/09/1645767.aspx

 

这个页面用的是 HTTP1.1 规范 我的浏览器版本是Mozilla/4.0

 

可以支持的MIME格式为 image/gif,text/html,application/pdf,image/png...等等

 

这个MIME格式我们response.setContentType("text/html;charset=gb2312");或者在一个 <%@ page contentType="text/html;charset=gb2312"%>                                     或者<meta .....contentType="text/html;charset=gb2312"..>总能见到

 

那么在这里如何理解 GET 和 POST 最直观的区别,最明显的就是 GET方法将数据的请求跟在了所请求的URL后面,也就是在请求行里面我们是这么样来做的:

GET lvpin/archive/2007/06/09/1645767.aspx

key=value&key=value&key=value......HTTP1.1

 

也实际上就是 用 GET 如此传递数据 :

http://blog.csdn.net/lvpin/archive/2007/06/09/1645767.aspx?name=simon&password=simonlv........

 

3.服务器端接受请求,处理数据后生成响应返回数据到客户端 (部分Servlet 内容穿插)

Web 服务器 解析请求,定位指定的资源http://blog.csdn.net/lvpin/archive/2007/06/09/1645767.aspx

 

1)根据在 请求时的 GET/POST 来按照响应的 doGet() /doPost()方法来处理(有可能是一些业务逻辑,也有可能是一些验证等等,也有可能是一些数据查询,提交等等)其有效的数据就来源于name=simon&password=simonlv,还有其它的一些封装在 request 对象中的数据资源。

2)处理请求之后,由 response 对象得到 PriterWriter 输出流对象out ,通过 out.println () 将数据以 在客户端提交过的采用的Accpt: 中形式的一种 如 按照 response.setcontentType("text/html;charset=gb2312' )的格式输出流。

它的响应信息与请求信息非常类似,其区别就在于 我们在请求阶段的请求行被状态行给替换了,一个响应由四个部分组成:状态行、响应头标、空行、响应数据

1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。

HTTP1.1 100 continue ------继续追加后继内容

HTTP1.1 200 OK       -----一切正常

HTTP1.1 301 Moved Permanently    ---请求的文档在其它地方,会自动连接

HTTP1.1 403 Forbidden   -------绝对拒绝你访问这个资源,不管授权没有

HTTP1.1 400 Bad Request -----客户端请求中的不良语法

HTTP1.1 404 Not Found ---最常见,绝对是大名鼎鼎的找不到

 

HTTP响应码:

1xx:提示性信息,告诉客户端应该对某些其它的动作做出响应

2xx:这些就代表了请求成功

3xx:重定向,为了完成请求,必须进一步执行的动作

4xx:客户端错误

500-599:服务器端的错误

 

2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。

Date: Sat31 Dec 2005 23:59:59 GMT     --响应生成的日期和时间

ContentType: text/html;charset=gb2312'                                                                                                                                                               

Content-Length: 122 ---响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。

 

3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。

 

4.响应数据:HTML文档和图像等,也就是HTML本身。out.println("<html>").......写出的。。。

 

<html>

<head>

<title>Welcom to simon lv 's home</title>

</head>

<body>

<!-- 这里是具体的内容,看到了这里

相信大家对 HTTP 工作原理和服务器交互过程已经很清楚了吧

--

</body>

</html>

 

5.服务器端关闭连接,客户端解析回发响应头,恢复页面

转载:http://www.cnblogs.com/zhangzt/archive/2011/09/14/2176171.html

posted @ 2011-12-04 18:16  暮山海风  阅读(215)  评论(0编辑  收藏  举报