HTTP协议详解

起初接触协议是区分post和get方式的区别,这是大多数程序员的共同点吧。还记得当初老师让我们死记硬背几点区别,然后一直模模糊糊的用着。今天写一篇接地气的详解给自己和大家。

一 首先 需要了解什么是协议。

协议这里指的是网络传输协议,是指计算机通信的共同语言。以上是官方的解释,跟以往一样都是那么“生动形象”。其实吧,怎么说呢,是一种传输方式。我们打一个比方,比如送快递。

快递员小张开着小蹦蹦带着快递,根据地址找到小刘的地址,根据客户要求直接送到了公司,快递为公司采购物品:“你好,天天快递,请问刘女士么?”,然后把包裹递了过来。

小刘:“对,谢谢!”然后小刘接过小张的快递包裹。

然后我贴出一个http协议中的post请求实例 (这是浏览器向服务器端发送的一个简单请求 跟浏览器检查里面Network请求的header不同,是因为浏览器的显示是为了方便开发经过处理之后的显示)

//请求行信息
POST /hello/index.jsp HTTP/1.1          //小张带着包裹 开着小蹦蹦
//请求头信息
Host: www.google.cn                //找到小刘公司
Content-Type: application/x-www-form         //根据要求送到公司
Content-Length: 14                 //快递数量 1
// 这里是空行                     //以上是准备过程
//POST有请求正文 username=hello                   //将快递包裹递过去
 

 下面我贴出一个http的响应报文跟小刘收快递作对比

//响应行
HTTP/1.1 200 OK                   //开门 成功见到小张
//消息报头 Date: Sat, 31 Dec 2005 23:59:59 GMT     //记录下快递接收时间 Content-Type: text/html;charset=ISO-8859-1   //接收方式直接柜台接收(大件需要卡车装卸) Content-Length: 122                //接收数量1 //空行

//响应体 响应正文               <html><head>                   //回应小张,快递是对了.谢谢! <title>that's right. think youu!</title> </head><body> <!-- body goes here --> </body></html>

这就是一个简单的post请求和响应的过程。当然这个比喻存在一车的漏洞,请不要注意那些细节谢谢! 

这个过程呢,在生活中可以叫作一种固定的交际方式。在计算机的世界里就叫作协议啦!这让我想起来google创始人佩奇的那句话,那些 怪怪 的程序员起的那些 怪怪 的名字。 囧................

下面我大概介绍一下协议种类,例如网络协议通信协议,如TCP/IP;文件传输协议FTP;超文本传输协议HTTP、HTTPS;用户数据报协议UDP;传输控制协议TCP 等等一大堆不认识的玩意,市面上常用的有四十多种。

二 HTTP协议

HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。
HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。这就可以理解成和快递公司之间复杂的合作了,包含无数个送快递的过程。

HTTP请求消息

一个HTTP请求报文由请求行(request line)、请求头(header)、空行和请求数据4个部分组成,下图给出了请求报文的一般格式。

 

1.请求行

请求行:请求方法   URL字段   HTTP协议版本   组成,它们用空格分隔。
例如, GET     /index.html  HTTP/1.1。

根据HTTP标准,HTTP请求可以使用多种请求方法。
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。

 

而常见的有如下几种:

1).GET

最常见的一种请求方式,当客户端要从服务器中读取文档时,当点击网页上的链接或者通过在浏览器的地址栏输入网址来浏览网页的,使用的都是GET方式。GET方法要求服务器将URL定位的资源放在响应报文的数据部分,回送给客户端。使用GET方法时,请求参数和对应的值附加在URL后面,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制。例如,/index.jsp?id=100&op=bind,这样通过GET方式传递的数据直接表示在地址中,所以我们可以把请求结果以链接的形式发送给好友。以用google搜索domety为例,请求链接为 

http://www.google.cn/search?hl=zh-CN&source=hp&q=domety&aq=f&oq= 

Request格式如下:

//请求行
GET /search?hl=zh-CN&source=hp&q=domety&aq=f&oq= HTTP/1.1
//请求头
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-silverlight, application/x-shockwave-flash, */* Referer: <a href="http://www.google.cn/">http://www.google.cn/
</a> Accept-Language: zh-cn Accept-Encoding: gzip, deflate User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld) Host: <a href="http://www.google.cn">www.google.cn</a> Connection: Keep-Alive Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261551909:LM=1261551917:S=ybYcq2wpfefs4V9g;NID=31=ojj8d-IygaEtSxLgaJmqSjVhC...
//空行(作用是告诉计算机下面要来数据体啦)

//因为没有数据后面请求体为空

 

地址中红色部分就是通过GET发送的请求数据,我们可以在地址栏中清楚的看到,各个数据之间用”&”符号隔开。所以就有了两个特点

1 这种方式不适合传送私密数据。

2 由于不同的浏览器对地址的字符限制也有所不同,一般最多只能识别1024个字符,所以如果需要传送大量数据的时候,也不适合使用GET方式。

 

2).POST

对于上面提到的不适合使用GET方式的情况,可以考虑使用POST方式,因为使用POST方法可以允许客户端给服务器提供信息较多。POST方法将请求参数封装在HTTP请求数据中,以名称/值的形式出现,可以传输大量数据,这样POST方式对传送的数据大小没有限制,而且也不会显示在URL中。还以上面的搜索domety为例,如果使用POST方式的话,格式如下:

//请求行
POST /search HTTP/1.1 //请求头
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-silverlight, application/x-shockwave-flash, */* Referer: <a href="http://www.google.cn/">http://www.google.cn/</a> Accept-Language: zh-cn Accept-Encoding: gzip, deflate User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld) Host: <a href="http://www.google.cn
">www.google.cn</a> Connection: Keep-Alive Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261551909:LM=1261551917:S=ybYcq2wpfefs4V9g;NID=31=ojj8d-IygaEtSxLgaJmqSjVhCspkviJrB6omjamNrSm8lZhKy_yMfO2M4QMRKcH1g0iQv9u-2hfBW7bUFwVh7pGaRUb0RnHcJU37y- //空行(作用是告诉计算机下面要来数据体啦)
 hl=zh-CN&source=hp&q=domety  //请求体 传输数据在请求体中

 

可以看到,POST方式请求行中不包含数据字符串,这些数据保存在”请求内容”部分,各数据之间也是使用”&”符号隔开。POST方式大多用于页面的表单中。因为POST也能完成GET的功能,因此多数人在设计表单的时候一律都使用POST方式,其实这是一个误区。GET方式也有自己的特点和优势,我们应该根据不同的情况来选择是使用GET还是使用POST。

 如果想了解请求头信息可以点击 请求头及响应头信息  详细信息点击这里 请求头参数解释

HTTP响应消息

HTTP响应也由三个部分组成,分别是:状态行、响应头、空行、响应正文。
正如你所见,在响应中唯一真正的区别在于第一行中用状态信息代替了请求信息。状态行(status line)通过提供一个状态码来说明所请求的资源情况。 

状态行: 协议及版本号  HTTP响应状态码  原因及描述

HTTP状态码

当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
HTTP状态码的英文为HTTP Status Code。状态代码由三位数字组成,第一个数字定义了响应的类别,且有五种可能取值。

  • 1xx:指示信息--表示请求已接收,继续处理。
  • 2xx:成功--表示请求已被成功接收、理解、接受。
  • 3xx:重定向--要完成请求必须进行更进一步的操作。
  • 4xx:客户端错误--请求有语法错误或请求无法实现。
  • 5xx:服务器端错误--服务器未能实现合法的请求。


常见状态代码、状态描述的说明如下。

    • 200 OK:客户端请求成功。
    • 400 Bad Request:客户端请求有语法错误,不能被服务器所理解。
    • 401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用。
    • 403 Forbidden:服务器收到请求,但是拒绝提供服务。
    • 404 Not Found:请求资源不存在,举个例子:输入了错误的URL。
    • 500 Internal Server Error:服务器发生不可预期的错误。
    • 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常,举个例子:HTTP/1.1 200 OK(CRLF)。

HTTP工作原理

HTTP三点注意事项:

  • HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
  • HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
  • HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

三 关于HTTP请求GET和POST的区别

1.GET提交,请求的数据会附在URL之后(就是把数据放置在HTTP协议头<request-line>中),以?分割URL和传输数据,多个参数用&连接;例如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果数据是英文字母/数字,原样发送,如果是空格,转换为+,如果是中文/其他字符,则直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX为该符号以16进制表示的ASCII。

  POST提交:把提交的数据放置在是HTTP包的包体<request-body>中。上文示例中红色字体标明的就是实际的传输数据

  因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变

2.传输数据的大小:

   首先声明,HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。 而在实际开发中存在的限制主要有:

   GET:特定浏览器和服务器对URL长度有限制,例如IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器,如Netscape、FireFox等,理论上没有长度限制,其限制取决于操作系统的支持。

   因此对于GET提交时,传输数据就会受到URL长度的限制。

   POST:由于不是通过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置。

3.安全性:

    POST的安全性要比GET的安全性高。注意:这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不作数据修改,而这里安全的含义是真正的Security的含义,比如:通过GET提交数据,用户名和密码将明文出现在URL上,因为(1)登录页面有可能被浏览器缓存, (2)其他人查看浏览器的历史纪录,那么别人就可以拿到你的账号和密码了,

参考文献:
百度百科 https://baike.baidu.com/item/%E7%BD%91%E7%BB%9C%E4%BC%A0%E8%BE%93%E5%8D%8F%E8%AE%AE/332131

CSDN博客 http://blog.csdn.net/javandroid/article/details/29884033

posted @ 2017-11-24 15:43  隆冬之夜99  阅读(530)  评论(0编辑  收藏  举报