servlet 中字符集的处理
Servlet运行的步骤
Servlet作为Web服务器的补充功能在运行时需要受到Servlet容器的管理,其运行的流程如下:
- 浏览器依据IP建立与容器的连接
- 浏览器将请求数据打包
- 容器解析请求数据包,封装request和response对象
- 容器依据请求资源路径找到Servlet创建对象
- 容器将request和response对象作为参数传入service方法,并调用
- 容器将响应数据打包发给浏览器
- 浏览器取出结果,生成页面
解决输出内容的乱码问题
在service()方法中第一行的位置上添加如下代码
response.setContentType("text/html;charset=utf-8")
其中charset可以使用其他支持中文的字符集,如GBK。setContentType()有两个作用:
- 通知容器,在调用out.println方法输出时,使用指定的字符集
- 生成一个消息头(content-type),通知浏览器,服务器返回的数据类型和字符集
使用该段代码修改默认的编码方式时,一定要保证在调用print之前编写,所以该段代码尽量放在service方法的第一行的位置。在charset之前使用的是分号隔开,如果写错,则会出现保存文件的界面,原因是浏览器不能识别消息头的值,于是让用户来处理
1 package com.yunhua.servlet; 2 3 import java.io.IOException; 4 import java.io.PrintWriter; 5 6 import javax.servlet.http.HttpServlet; 7 import javax.servlet.http.HttpServletRequest; 8 import javax.servlet.http.HttpServletResponse; 9 10 public class ServletTest extends HttpServlet { 11 public void service(HttpServletRequest request, HttpServletResponse response) { 12 response.setContentType("text/html;charset=utf-8");//放在第一行 13 PrintWriter out = null; 14 try { 15 out = response.getWriter(); 16 } catch (IOException e) { 17 // TODO Auto-generated catch block 18 e.printStackTrace(); 19 } finally { 20 out.print("中文"); 21 out.close(); 22 } 23 } 24 }
为什么表单提交中文会出现乱码
当表单提交时,浏览器会对表单中的中文参数值进行编码,而使用的编码是打开页面时所使用的字符集,如当前页面使用的UTF-8的字符集进行显示的,那么表单提交的数据就会以UTF-8的方式进行编码后传输,而Web服务器在默认情况下对提交的表单数据会使用ISO-8859-1的字符集来解码,编码与解码的方式不一致就产生了表单提交时的中文乱码问题。
如何解决表单提交时的中文乱码问题
步骤一、确保表单所在的页面按照指定的字符集打开
在HTML页面中使用meta标记可以确保浏览器按照指定的字符集进行解码页面,并限定表单提交时的数据编码方式
1 <meta http-equiv="content-type" content="text/html;charset=utf-8">
在服务器端需要在调用getParameter方法读取参数之前,告诉浏览器如何解码,使用如下代码即可完成该设置:
1 request.setCharacterEncoding("utf-8");
注意该方法一定要要放在所有request.getParameter方法之前。
这种方式只针对POST请求有效。
解决GET方式提交时的中文乱码问题
步骤一、确保表单所在的页面按照指定的字符集打开
在HTML页面中使用meta标记可以确保浏览器按照指定的字符集进行解码页面,并限定表单提交时的数据编码方式
<meta http-equiv="content-type" content="text/html;charset=utf-8">
步骤二、完成ISO-8859-1到UTF-8格式的转换
1 String username = request.getParameter(“username”); 2 username = new String(username.getBytes(“iso-8859-1”),“UTF-8”);
由于GET方式提交的任何数据在服务器端一定会以ISO-8859-1的方式进行解码,所以服务器端可以先按ISO-8859-1的方式获取字节数组,在将该数组转变成UTF-8对应的字符串形式。
1 package com.yunhua.servlet; 2 3 import java.io.IOException; 4 import java.io.PrintWriter; 5 6 import javax.servlet.http.HttpServlet; 7 import javax.servlet.http.HttpServletRequest; 8 import javax.servlet.http.HttpServletResponse; 9 10 public class ServletTest extends HttpServlet { 11 public void service(HttpServletRequest request, HttpServletResponse response) { 12 response.setContentType("text/html;charset=utf-8");//放在第一行 13 PrintWriter out = null; 14 try { 15 request.setCharacterEncoding("UTF-8"); //放在前面拦截post请求的数据 16 //将iso-8859-1装换成指定字符集 17 String param = new String(request.getParameter("").getBytes("iso-8859-1"), "UTF-8"); 18 out = response.getWriter(); 19 } catch (IOException e) { 20 // TODO Auto-generated catch block 21 e.printStackTrace(); 22 } finally { 23 out.print("中文"); 24 out.close(); 25 } 26 } 27 }