HTTP权威指南学习心得

一.HTTP请求的步骤：

1.从url中读取主机名

2.利用DNS(domain name service)对主机名进行转换，得到IP地址

3.如果有端口号的话，读取端口号

4.根据IP地址和端口号，建立与服务端的TCP(transmission control protocol)/IP连接

5.往服务端发送请求报文

6.客户端得到响应报文

7.断开连接

如下图：

二.URL：提供了定位因特网任意资源的手段，每一个资源都有一个唯一的url.

一个url由下面的格式组成:

一般，常用的是schema,host和path

例如http://www.baidu.com:80/index.html,http说明了用http协议，www.baidu.com为主机名，80为端口号，/index.html表示资源在服务器的路径

参数(params)的作用：解析url的时候可能需要这些参数来访问资源。例如，我们想通过ftp协议来访问图片，希望以二进制的形式来返回图片信息。就可以通过

　　ftp://prep.ai.mit.edu/pub/gnu;type=d

　　这样解析url的应用程序就可以通过读取参数来更好的访问资源,达到用户所想达到的结果

查询字符串(query)的作用：例如我们想获取id=5和author=cjg的那篇文章(多个参数，用&隔开)，我们可以通过访问

　　http://myblog.com/passages?id=5&author=cjg

　　这样，就可以根据id这个值来返回实际需求的数据

三. 报文流

　　流入(inbound)：报文流入源端服务器

　　流出(outbound): 响应报文流回客户端

　　上游(upstream)，下游(downstream): 至于发送者与接收者有关，发送者在上游，接收者在下游

报文组成部分: 起始行(start line)，首部(header)，主体(body)

如下图

报文分类：请求报文（向服务器请求一个动作)与响应报文(服务器将请求的结果返回给客户端)

请求报文格式:

<entity-body>

响应报文格式:

<entity-body>

请求行：方法表明了本次请求的方法(GET/POST), URL表明请求的资源的地址

响应行：版本号状态码以及结果原因

响应状态码来表明你这次操作成功与失败，以及原因。状态码分类如下：

HTTP的连接方式:

　　1.串行连接

　　2.并行连接

　　3.持久连接:在完成TCP传输后，TCP连接并不会立刻关掉，一般会等到客户端关闭或者服务器主动关掉

　　客户端如何使用持久连接:

　　　　1.HTTP/1.0+ Connecttion: Keep-Alive，如果响应中没有Connecttion: Keep-Alive，就认为服务器不支持keep-alive,会在得到响应报文后就关闭连接

　　　　2.HTTP/1.1 persistent

　　　　keep-alive有几个参数，timeout指的是服务器将连接保持在活跃状态的时间，max表示服务器还希望为多少个事务保持此连接的活跃状态

　　　　如上图，表示服务器最多会为其他另外5个事务保持连接的打开状态，打开状态保持到连接空闲了2分钟之后。

代理与网关：在客户端与服务器进行交互的时候，有可能需要通过代理作为中介来完成交互过程。

　　如上图，代替接收客户端的请求报文，经过处理后再发给web服务器，然后再接收web服务器的响应报文,发送给客户端

　　对于客户端而言，他就是个服务端，而对于服务器而言，他就是客户端。

　　那么，代理和网关有什么区别呢？

　　　　简单的说，代理处理的是两个或者多个相同协议的应用程序，都是HTTP协议。而网关一般处理的是两个或者多个使用不同协议的应用程序.

　　　　如下图，网关处理的是HTTP协议的浏览器，以及POP协议的E-mail服务器.

　　为什么使用代理？

　　　　能改善安全性，提高性能:代理服务器可以看到并且接触到所有流过的HTTP流量，因此他可以监视并且修改内容。可以用这个来实现很多功能，例如，儿童过滤器，在某些小学他们就使用了一些代理，当用户访问网站的时候，代理服务器会观察你访问的网站是否是成人内容！！！！是的话，就阻止你去看！！！！！、

　　代理能做什么？

　　　　1.内容转码器：代理可以将响应报文的主体部分进行转码，转换为不同的语言。

　　　　2.内容路由器：可以将请求导向不同的Web服务器。假如，有家公司提供了收费服务，付费的用户的话，内容路由器可能会将它的请求发送到附近的缓存上，这样就能更快的得到想要的内容

　　　　3.刚才所说的儿童过滤器，对访问内容进行筛选限制

Cookie:

　　分为会话cookie和持久cookie,会话cookie会在你关掉浏览器后被删除，持久cookie会保存在电脑硬盘一段时间，具体保存时间由服务器当时设置的Expires/Max-Age的参数而定。

　　如何工作？

　　　　cookie就是服务器用来区别每一个用户的一个标签，每一个cookie就对应着一个唯一的用户，当用户访问web服务器的时候，服务器希望这个用户可能会回来，并给他贴上了一个cookie标签，为了方便以后它回来的时候可以直接识别他，可以免去登录等步骤，还可以记录这个用户的一些偏好。在用户第一次发出请求的时候，服务器可以通过返回set-Cookie的首部将cookie返回给用户.之后用户再次登录该网站的时候，就会自动发送cookie内容，服务器就可以识别出这个用户具体是谁了。