javaWeb项目-文件下载的消息头和编码问题

转载于:https://www.cnblogs.com/hackxiyu/p/9046247.html
一个比较优秀的学习http协议的网站: https://developer.mozilla.org/zh-CN/docs/Web/HTTP

一、问题：

　　做web项目经常提到的一个需求就是页面的文件下载，那么下载的时候在后台为什么要设置响应消息头？为什么这样设置？

二、解决：

1、例子

//设置响应的消息头response.setContentType("text/html;charset=UTF-8");//设置响应类型中包含文件附件
response.setHeader("Content-Disposition", "attachment; " +
                    "filename="+new String(AREA_FILE.getBytes("gb2312"), "ISO-8859-1"));

2、setContentType：

　　　　它的作用就是，设置客户端的MIME类型【多类型邮件传输协议】，浏览器可以根据该类型来指定程序解析对应类型的文件

　　　　比如，servlet里写入了一个标签，如果不指定为jpg类型，页面是不能直接显示的

　　　　它的默认类型是[text/html]类型，所以返回的是html也可以不设置

　　　　包括下载文件的时候，不指定也是可以的，因为后边还设置了携带的响应附件，可以支持文件的下载

　　　　也可以指定响应的编码，让浏览器可以正确的显示信息

3、setHeader：

　　　　它的作用就是设置响应的头部

　　　　Content-Disposition：指明响应的配置信息

　　　　attachment：指明包含附件

4、new String(AREA_FILE.getBytes("gb2312"), "ISO-8859-1"))

　　　　这里特别说明，如果文件名不包含中文可以不设置该项

　　　　如果包含中文名，则需要设置编码，否则文件名下载后中文字符会乱码

　　　　其中，getBytes指定了编码的方式，ISO-8859-1指定了解码（读取）的方式

　　　　想要转换编码，就是先编码，再解码

　　　　如：

　　　　　　utf-8转gbk ：new String(str.getBytes("gbk"), "gbk"))

　　　　　　gbk转utf-8 ：new String(str.getBytes("utf-8"), "utf-8"))

三、扩展：

　　那么为什么下载的文件名中的中文字符会乱码？

　　首先，我们常用的编码:

　　（1）ISO-8859-1：它是单字节编码，tomcat默认的字符编码方式，但是可以标识的字符量比较少

　　（2）unicode：单字节编码

　　（3）gb2312：我们大中国的汉字编码，两个字节标识一个汉字

　　（4）UTF-8：万国码，支持世界字符，是可变的长度编码，字节数不定

　　乱码的出现就是因为，java的字符串默认采用的编码是unicode编码，而tomcat传输又更改为iso-8859-1，

　　页面读取的时候，碰到汉字本来双字节的读取成了单字节，出现了乱码

　　所以要把字符串以【gbk】编码，再以【iso-8859-1】读取相应的字符，传递到页面就是【iso-8859-1】,可以正常显示中文字符

posted @ 2020-11-15 17:30 刺客伍六七阅读(596) 评论(0) 收藏举报

刷新页面返回顶部

刺客伍六七