http 知识整理

HTTP 简介

HTTP协议是Hyper Text Transfer Protocol（超文本传输协议）的缩写,是用于从万维网（WWW:World Wide Web ）服务器传输超文本到本地浏览器的传送协议。。

HTTP是一个基于TCP/IP通信协议来传递数据（HTML 文件, 图片文件, 查询结果等）。又叫无状态超文本传输协议

HTTP 工作原理

HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。

Web服务器有：Apache服务器，IIS服务器（Internet Information Services）等。

Web服务器根据接收到的请求后，向客户端发送响应信息。

HTTP默认端口号为80，但是你也可以改为8080或者其他端口。

HTTP三点注意事项：

HTTP是无连接：无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。
HTTP是媒体独立的：这意味着，只要客户端和服务器知道如何处理的数据内容，任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
HTTP是无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。另一方面，在服务器不需要先前信息时它的应答就较快

实例

下面实例是一点典型的使用GET来传递数据的实例：

客户端请求：

GET /hello.txt HTTP/1.1   //请求行
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3 //请求头
Host: www.example.com   //请求头
Accept-Language: en, mi //请求头

服务端响应:

HTTP/1.1 200 OK //状态行
Date: Mon, 27 Jul 2009 12:28:53 GMT //消息报头
Server: Apache  //消息报头
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT  //消息报头
ETag: "34aa387-d-1568eb00" Accept-Ranges: bytes Content-Length: 51 Vary: Accept-Encoding Content-Type: text/plain //消息报头

输出结果：

Hello World! My payload includes a trailing CRLF.

HTTP请求报文头属性 
报文头属性是什么东西呢？我们不妨以一个小故事来说明吧。

引用
快到中午了，张三丰不想去食堂吃饭，于是打电话叫外卖：老板，我要一份[鱼香肉丝]，要12：30之前给我送过来哦，我在江湖湖公司研发部，叫张三丰。


这里，你要[鱼香肉丝]相当于HTTP报文体，而“12：30之前送过来”，你叫“张三丰”等信息就相当于HTTP的报文头。它们是一些附属信息，帮忙你和饭店老板顺利完成这次交易。 

请求HTTP报文和响应HTTP报文都拥有若干个报文关属性，它们是为协助客户端及服务端交易的一些附属信息。

常见的HTTP请求报文头属性

Accept 

请求报文可通过一个“Accept”报文头属性告诉服务端 客户端接受什么类型的响应。 

如下报文头相当于告诉服务端，俺客户端能够接受的响应类型仅为纯文本数据啊，你丫别发其它什么图片啊，视频啊过来，那样我会歇菜的~~~：

Accept:text/plain

Accept属性的值可以为一个或多个MIME类型的值，关于MIME类型，大家请参考：http://en.wikipedia.org/wiki/MIME_type 

Cookie 

客户端的Cookie就是通过这个报文头属性传给服务端的哦！如下所示：

Java代码

Cookie: $Version=1; Skin=new;jsessionid=5F4771183629C9834F8382E23BE13C4C



服务端是怎么知道客户端的多个请求是隶属于一个Session呢？注意到后台的那个jsessionid=5F4771183629C9834F8382E23BE13C4C木有？原来就是通过HTTP请求报文头的Cookie属性的
jsessionid的值关联起来的！（当然也可以通过重写URL的方式将会话ID附带在每个URL的后面哦）。

Referer 

表示这个请求是从哪个URL过来的，假如你通过google搜索出一个商家的广告页面，你对这个广告页面感兴趣，鼠标一点发送一个请求报文到商家的网站，这个请求报文的Referer报文头属性值就是
http://www.google.com。

引用
唐僧到了西天.
如来问：侬是不是从东土大唐来啊？
唐僧：厉害！你咋知道的！
如来：呵呵，我偷看了你的Referer...




很多貌似神奇的网页监控软件（如著名的 我要啦），只要在你的网页上放上一段JavaScript，就可以帮你监控流量，全国访问客户的分布情况等报表和图表，其原理就是通过这个Referer及其它一些HTTP报文头工作的。 

Cache-Control 

对缓存进行控制，如一个请求希望响应返回的内容在客户端要被缓存一年，或不希望被缓存就可以通过这个报文头达到目的。 

如以下设置，相当于让服务端将对应请求返回的响应内容不要在客户端缓存：

Cache-Control: no-cache

 

其它请求报文头属性 

参见：http://en.wikipedia.org/wiki/List_of_HTTP_header_fields 

如何访问请求报文头 

由于请求报文头是客户端发过来的，服务端当然只能读取了，以下是HttpServletRequest一些用于读取请求报文头的API：

Java代码

//获取请求报文中的属性名称
java.util.Enumeration<java.lang.String> getHeaderNames();
//获取指定名称的报文头属性的值
java.lang.String getHeader(java.lang.String name)




由于一些请求报文头属性“太著名”了，因此HttpServletRequest为它们提供了VIP的API：

Java代码

//获取报文头中的Cookie(读取Cookie的报文头属性）
Cookie[] getCookies() ;
//获取客户端本地化信息（读取 Accept-Language 的报文头属性）
java.util.Locale getLocale()
//获取请求报文体的长度（读取Content-Length的报文头属性）
int getContentLength();




HttpServletRequest可以通过

Java代码

HttpSession getSession()



获取请求所关联的HttpSession,其内部的机理是通过读取请求报文头中Cookie属性的JSESSIONID的值，在服务端的一个会话Map中，根据这个JSESSIONID获取对应的HttpSession的对象。（这样，你就不会觉得HttpSession很神秘了吧，你自己也可以做一个类似的会话管理  ） 

HTTP响应报文解剖 

响应报文结构 

HTTP的响应报文也由三部分组成（响应行+响应头+响应体）： 

 

以下是一个实际的HTTP响应报文： 

 

①报文协议及版本； 
②状态码及状态描述； 
③响应报文头，也是由多个属性组成； 
④响应报文体，即我们真正要的“干货”。 

响应状态码 

和请求报文相比，响应报文多了一个“响应状态码”，它以“清晰明确”的语言告诉客户端本次请求的处理结果。 

HTTP的响应状态码由5段组成：

1xx 消息，一般是告诉客户端，请求已经收到了，正在处理，别急...
2xx 处理成功，一般表示：请求收悉、我明白你要的、请求已受理、已经处理完成等信息.
3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。
4xx 处理发生错误，责任在客户端，如客户端的请求一个不存在的资源，客户端未被授权，禁止访问等。
5xx 处理发生错误，责任在服务端，如服务端抛出异常，路由出错，HTTP版本不支持等。




以下是几个常见的状态码： 

200 OK 

你最希望看到的，即处理成功！ 

303 See Other 

我把你redirect到其它的页面，目标的URL通过响应报文头的Location告诉你。

引用

悟空：师傅给个桃吧，走了一天了

唐僧：我哪有桃啊！去王母娘娘那找吧


304 Not Modified 

告诉客户端，你请求的这个资源至你上次取得后，并没有更改，你直接用你本地的缓存吧，我很忙哦，你能不能少来烦我啊！ 

404 Not Found 

你最不希望看到的，即找不到页面。如你在google上找到一个页面，点击这个链接返回404，表示这个页面已经被网站删除了，google那边的记录只是美好的回忆。 

500 Internal Server Error 

看到这个错误，你就应该查查服务端的日志了，肯定抛出了一堆异常，别睡了，起来改BUG去吧！ 


其它的状态码参见：http://en.wikipedia.org/wiki/List_of_HTTP_status_codes 


有些响应码，Web应用服务器会自动给生成。你可以通过HttpServletResponse的API设置状态码：

Java代码

//设置状态码，状态码在HttpServletResponse中通过一系列的常量预定义了，如SC_ACCEPTED，SC_OK
void setStatus(int sc)




常见的HTTP响应报文头属性 

Cache-Control 

响应输出到客户端后，服务端通过该报文头属告诉客户端如何控制响应内容的缓存。 

下面，的设置让客户端对响应内容缓存3600秒，也即在3600秒内，如果客户再次访问该资源，直接从客户端的缓存中返回内容给客户，不要再从服务端获取（当然，这个功能是靠客户端实现的，服务端只是通过这个属性提示客户端“应该这么做”，做不做，还是决定于客户端，如果是自己宣称支持HTTP的客户端，则就应该这样实现）。

Java代码

Cache-Control: max-age=3600




ETag 

一个代表响应服务端资源（如页面）版本的报文头属性，如果某个服务端资源发生变化了，这个ETag就会相应发生变化。它是Cache-Control的有益补充，可以让客户端“更智能”地处理什么时候要从服务端取资源，什么时候可以直接从缓存中返回响应。 

关于ETag的说明，你可以参见：http://en.wikipedia.org/wiki/HTTP_ETag。 
Spring 3.0还专门为此提供了一个org.springframework.web.filter.ShallowEtagHeaderFilter（实现原理很简单，对JSP输出的内容MD5，这样内容有变化ETag就相应变化了），用于生成响应的ETag，因为这东东确实可以帮助减少请求和响应的交互。 

下面是一个ETag：

Java代码

ETag: "737060cd8c284d8af7ad3082f209582d"




Location 

我们在JSP中让页面Redirect到一个某个A页面中，其实是让客户端再发一个请求到A页面，这个需要Redirect到的A页面的URL，其实就是通过响应报文头的Location属性告知客户端的，如下的报文头属性，将使客户端redirect到iteye的首页中：

Java代码

Location: http://www.iteye.com




Set-Cookie 

服务端可以设置客户端的Cookie，其原理就是通过这个响应报文头属性实现的：

Java代码

Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1





其它HTTP响应报文头属性 

更多其它的HTTP响应头报文，参见：http://en.wikipedia.org/wiki/List_of_HTTP_header_fields 


如何写HTTP请求报文头 

在服务端可以通过HttpServletResponse的API写响应报文头的属性：

Java代码

//添加一个响应报文头属性
void setHeader(String name, String value)




象Cookie，Location这些响应都是有福之人，HttpServletResponse为它们都提供了VIP版的API：

Java代码

//添加Cookie报文头属性
void addCookie(Cookie cookie)
//不但会设置Location的响应报文头，还会生成303的状态码呢，两者天仙配呢
void sendRedirect(String location)

posted @ 2018-05-17 17:36 二月花开阅读(105) 评论(0) 编辑收藏举报

刷新页面返回顶部

二月花开

牡丹虽好，终须绿叶扶持

http 知识整理

HTTP 简介

HTTP 工作原理

实例