javaWeb学习总结(2)- http协议
一.http简介
1.基本介绍:
(1)客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式。
(2)WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。
(3)HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议集中的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式。
2、HTTP协议的版本 :HTTP/1.0、HTTP/1.1
3、学习http协议的原因:HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有特殊用途的WEB服务器程序具有直接影响。
二.HTTP 1.0的会话方式
1.会话方式的四个步骤:建立连接、发出请求信息、回送响应信息、关闭连接
2.http1.0和http1.1的比较区别特点:
http1.0的特点:
(1)浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。
(2)对每一个页面的访问,浏览器与WEB服务器都要建立一次单独的连接。
(3)浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应。
(4)客户端与web服务器建立连接后,只能获得一个web资源。
HTTP 1.1的特点:
(1)在一个TCP连接上可以传送多个HTTP请求和响应
(2)多个请求和响应过程可以重叠进行
(3)增加更多的请求头和响应头
(4)允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
3、使用telnet举例说明步骤:
⑴输入telnet localhost 8080 然后回车
⑵按ctrl+]
⑶发送请求,输入(格式:(GET/路径 HTTP/1.1)) GET/news/1.html HTTP/1.1
⑷然后回车,输入Host
三、安装IE浏览器插件HttpWatch,查看IE浏览器通过HTTP协议获取某个页面。
HttpWatch工具的使用
(1)功能:监听和截获本地机器每次向服务器发送的http请求数据和服务器向本地机器返回的http响应数据。
(2)下载:http://www.httpwatch.com/
(3)直接双击下载文件安装即可。
(4)打开IE浏览器,选择“工具”→“浏览器栏”→“HttpWatchProfessional”。
(5)这样操作之后,就可以打开HttpWatch工具了。
四、http请求消息:
1、客户端连上服务器后,向服务器请求某个web资源,称为客户端向服务器发送了一个HTTP请求。
2、请求消息的结构:一个请求行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开(请求行,消息头,空行,请求数据).
3、
3.1请求行 :
用于描述客户端的请求方式、请求的资源名称,以及使用的http协议版本号
(1)请求方式:POST、GET、HEAD、OPTIONS、DELETE、TRACE、PUT
①常用的有: GET、 POST
用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。
②GET方式可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔,例如:GET /mail/1.html?name=abc&password=xyz HTTP/1.1
特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。
③POST方式:可以在请求的实体内容中向服务器发送数据。
特点:传送的数据量无限制。
④注意:不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上
3.2 多个消息头:
消息头用于描述客户端请求哪台主机,和客户端的一些环境信息等
消息头用于HTTP请求中的常用头
①Accept: text/html,image/* 说明客户端可以接收的数据格式
②Accept-Charset: ISO-8859-1 说明客户端可以使用的字符集
③Accept-Encoding: gzip,compress说明客户机能进行解码的数据编码方式
④Accept-Language: en-us,zh-cn 用于指定客户机期望服务器返回哪个国家语言的文档
⑤Host: www.it315.org:80 用于指定资源所在的主机号和端口号
⑥If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT 用于指定时间
⑦Referer: http://www.it315.org/index.jsp 指定发出请求的超链接源的url
⑧User-Agent:Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) 用于指定浏览器或其他客户端程序的类型和名称
⑨Cookie 客户端可以带消息给服务器端
⑩Connection:close/Keep-Alive 告诉服务器完成这次请求后,和服务器是否保持连接
11.Date: Tue, 11 Jul 2000 18:23:51 GMT
举例说明:
GET /books/java.html HTTP/1.1 请求行
Accept: */*
Accept-Language: en-us
Connection: Keep-Alive
Host: localhost 多个消息头
Referer: http://localhost/links.asp
User-Agent: Mozilla/4.0
Accept-Encoding: gzip, deflate
一个空行
五、HTTP响应消息:
1、一个HTTP响应代表服务器向客户端回送的数据
2、结构:一个状态行、若干消息头、以及实体内容。(状态行、消息头、空行、响应数据)
3、
状态行:
用于描述服务器对请求的处理结果
①格式:HTTP版本号 状态码 原因叙述<CRLF>
举例:HTTP/1.1 200 OK
②状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类
状态码 |
含义 |
100~199 |
表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程 |
200~299 |
表示成功接收请求并已完成整个处理过程,常用200 |
300~399 |
为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址,常用302、307和304 |
400~499 |
客户端的请求有错误,常用404 |
500~599 |
服务器端出现错误,常用 500 |
③响应状态码典型情况
ⅰ 200(正常) 表示一切正常,返回的是正常请求结果。
ⅱ 302/307(临时重定向)指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
ⅲ 304(未修改)表示客户机缓存的版本是最新的,客户机应该继续使用它。
ⅳ 403(禁止)服务器理解客户端请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置所致。
ⅴ 404(找不到) 服务器上不存在客户机所请求的资源。
ⅵ 500(内部服务器错误) 服务器端的CGI、ASP、JSP等程序发生错误。
4、
多个消息头:
用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据
消息头中的常用响应头
(1)Location: http://www.it315.org/index.jsp 用于通知客户机应该到那个新的地址去获取文档
(2)Server:apache tomcat 用于指定服务器软件的产品名称
(3)Content-Disposition: attachment; filename=aaa.zip
(4)Transfer-Encoding: chunked
(5)Set-Cookie:SS=Q0=5Lb_nQ; path=/search
(6)ETag: W/"7777-1242234904000"
(7)Cache-Control: no-cache
(8)Pragma: no-cache
(9)Connection: close/Keep-Alive
(10)Date: Tue, 11 Jul2000 18:23:51 GMT
在一个HTTP响应中,WEB服务器通过响应头向web客户端描述客户端的请求成功与否,以及它所发送的数据类型等一些信息,客户端通过这些信息,进而可以知道如何对数据进行处理
5、
实体内容:
代表服务器向客户端回送的数据
实体头:
(1)Content-Encoding: gzip 用于指定实体内容的压缩编码方式
(2)Content-Length: 80 用于表示实体内容的长度
(3)Content-Language: zh-cn 用于指定返回的网页文档的国家语言类型。
(4)Content-Type: text/html; charset=GB2312 响应头字段中指定的MIME类型(MIME型是指实体内容压缩编码钱的类型)
(5)Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT 用于指定文档的最后更改时间,设置为GMT格式
(6)Expires:-1 用于指定当前文档应该在什么时候被认为过期
举例说明:
HTTP/1.1200 OK 状态行
Server: Microsoft-IIS/5.0
Date:Thu, 13 Jul 2000 05:46:53 GMT
Content-Length:2291 多个消息头
Content-Type:text/html
Cache-control:private
一个空行
<HTML>
实体内容
<BODY>
……
六、扩展头
在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。
现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
Refresh头字段 用于告诉浏览器过多少秒后自动刷新页面
Refresh: 1
Refresh: 1;url=http://www.it315.org
Content-Disposition头字段 指定了接收程序处理数据内容的方式。
Content-Type:application/octet-stream
Content-Disposition: attachment;filename=aaa.zip
Content-disposition 是 MIME 协议的扩展,MIME 协议指示 MIME 用户代理如何显示附加的文件。Content-disposition其实可以控制用户请求所得的内容存为一个文件的时候提供一个默认的文件名,文件直接 在浏览器上显示或者在访问时弹出文件下载对话框。
格式说明:
content-disposition = "Content-Disposition" ":" disposition-type *( ";" disposition-parm )
字段说明:
Content-Disposition为属性名
disposition-type是以什么方式下载,如attachment为以附件方式下载
disposition-parm为默认保存时的文件名。
在进行Web开发时,可能遇到遇到以下几种需求:
l 希望某类或者某已知MIME 类型的文件(比如:*.gif;*.txt;*.htm)能够在访问时弹出“文件下载”对话框。
l 希望客户端下载时以指定文件名显示。
l 希望某文件直接在浏览器上显示而不是弹出文件下载对话框。
对于上面的需求,使用Content-Disposition属性就可以解决。下面是代码示例:
response.setHeader("Content-disposition", "attachment;filename=" + fileName)。
//Content-disposition为属性名。
//attachment表示以附件方式下载。如果要在页面中打开,则改为inline。
//filename如果为中文,则会出现乱码。解决办法有两种:
//1、使用fileName = new String(fileName.getBytes(), "ISO8859-1")语句
//2、使用fileName = HttpUtility.UrlEncode(filename, System.Text.Encoding.UTF8)语句
response.setHeader(
"Content-disposition"
,
"attachment; filename=word.doc"
);
attachment;这个很重要,没有这个就直接打开了
扩展
1.直接下载文件,直接路径是服务器路径
<a href="xxx/attachment/excel.xls">Excel文件模板</a>
2.手动处理下载,如导出excel
HSSFWorkbook workbook = xxxx;
if (workbook != null) {
OutputStream out = response.getOutputStream();
response.setHeader(
"Content-disposition",
"attachment; filename="
+ new String("excel.xls".getBytes("GBK"),
"ISO-8859-1"));
response.setContentType("application/msexcel;charset=UTF-8");
workbook.write(out);
out.flush();
out.close();
}
3.
http下载文件(通用格式)
http://www.cnblogs.com/crazylqy/p/4150655.html