处理Jsp出现乱码问题
request对象的setCharacterEncoding()方法用于设置字符集,可以用来解决中文乱码问题。为什么会出现中文乱码问题?
常用的字符集编码有ASCII、ISO-8859-1、GB2312、GBK、Unicode、UTF-8等,Java在其内部使用Unicode字符集来表示字符,这样就存在Unicode字符集和本地字符集进行转换的过程。在web应用中,通常都包括了浏览器,Web服务器,Web应用程序和数据库等部分,每一部分都有可能使用不同的字符集,从而导致字符数据在各种不同的字符集之间转换时,出现乱码问题。
对于中文乱码问题,根据产生的原因,主要有以下几种解决方案。
1、以POST方法提交的表单数据中有中文字符时。
Tomcat对请求数据默认采用ISO-8859-1字符集进行编码,request对象的getParameter()方法得到的字符串是以ISO-8859-1转换而来的。所以在获取请求参数值之前,调用setCharacterEncoding("UTF-8")方法,将请求的解码方式设定为UTF-8。
<%@ page language="java" pageEncoding="UTF-8" %>
<%
request.setCharacterEncoding("UTF-8");
String name = request.getParameter("name");
%>
注意:页面和浏览器发送请求也应一致使用UTF-8编码,通过JSP页面设置page指令的contentType属性,指定页面内容的编码格式如下。
<%@ page contentType="text/html";charaset="UTF-8" %>
说明:
contentType和pageEncoding的区别:contentType定义响应的资源类型,也可以包含JSP页面和响应内容的字符集;pageEncoding指定JSP文件的字符集及默认的contentType字符集。
2、以GET方法提交
当采用GET方式提交表单时,提交的数据作为查询字符串被附加到URL的末端发送到服务器,对于这部分数据,在服务器端调用setCharacterEncoding()方法是不起作用的,我们需要在得到请求参数值后进行编码转换。
String name = request.getParameter("name");
name = new String(name.getBytes("ISO-8859-1"),"UTF-8");
其中,name.getBytes("ISO-8859-1)按照"ISO-8859-1"字符集编码把name字符串转换为byte数组,再通过new String()方法,使用指定的"UTF-8"字符集把byte数组构造为一个新的String。
3、在Tomcat中设置字符集。
当表单采用GET方法提交时,虽然可以通过构造一个新的String的方法解决中文乱码问题,但是当获取多个参数值时,每个参数都进行重新编码,操作比较繁琐,效率也不高。这时可以通过在Tomcat中设置字符集的方式解决,配置方式如下:找到Tomcat目录结构\conf\server.xml文件,在<Connector>元素中添加URIEncoding属性,将它的值设置为"UTF-8"。代码如下所示:
1 <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />