JSP中文编码经验小结

影响JSP编码的两个属性:contentType 和 pageEncoding ;

首先,我们先了解一下JSP的编码规则,从中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服务器发送给客户端时的内容编码.而pageEncoding是jsp文件本身的编码.
 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
         第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
        第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
        JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
        第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的設定.
         pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

从此我们可以看出,  pageEncoding影响的是JSP编绎成.java文件(即servlet文件)阶段,此时如果pageEncoding设定错了,用一般的编绎器编绎出来的.java文件中就会出现中文乱码. 而用eclipse的话会提示你编码错误..
而contentType影响的是最后一个阶段,即由Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码(也就是.class文件)的阶段, 我们在客户端看到的结果就是此阶段产生的,  这时的编码就是根据contentType来设定. 光从客户端来说,pageEncoding 和contentType设置的不一样,例pageEncoding=GB2312,contentType的charset=UTF-8,此时客户端显示的JSP页面都能够正常显示中文乱码.

但是更重要的是与服务器的交互...   当从一个JSP页面发送请求至服务器端时, header中会发送什么数据呢?
header中发送的编码设定是由contentType指定的..  此时如果contentType指定的编码与服务器的编码不一致时,在服务器端就会产生中文乱码!
这是我经过多次实验得出的结果-_-|||  希望大家不会再为JSP的中文乱码问题头痛.. (统一编码为UTF-8是王道)

在开发J2EE WEB应用时最好使用过滤器来杜绝中文乱码的问题.  附过滤器源码:
import java.io.IOException;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;

public class SetCharacterEncodingFilter implements Filter {
 private String encoding;
 public void init(FilterConfig filterConfig) throws ServletException {
  // TODO Auto-generated method stub
  this.encoding=filterConfig.getInitParameter("encoding");
 }

 public void doFilter(ServletRequest request, ServletResponse response,
   FilterChain chain) throws IOException, ServletException {
  // TODO Auto-generated method stub
  request.setCharacterEncoding(this.encoding);
  chain.doFilter(request,response);
 }

 public void destroy() {
  // TODO Auto-generated method stub

 }

}

在web.xml中添加以下代码:

  <filter>
   <filter-name>SetCharacterEncodingFilter</filter-name>
   <filter-class>org.hilor.servlet.SetCharacterEncodingFilter</filter-class>
   <init-param>
    <param-name>encoding</param-name>
    <param-value>UTF-8</param-value>
   </init-param>
  </filter>

   <filter-mapping>
   <filter-name>SetCharacterEncodingFilter</filter-name>
   <url-pattern>/*</url-pattern>  
  </filter-mapping>
posted @ 2009-01-04 17:27  雾中慢跑  阅读(304)  评论(0编辑  收藏  举报