URL query string中文字符问题
如果URL的query string中包含中文字符,在不做特殊处理的情况下通过 request.getParameter 方法是获取不到正确的信息的,这是由于下面的两个机制造成的
- 浏览器会自动对URL中的特殊字符进行编码,比如请求 localhost:8080/TestJSp/loginMiddle.jsp?name=测试,真正请求的URL是localhost:8080/TestJSp/loginMiddle.jsp?name=%E6%B5%8B%E8%AF%95,即浏览器自动对中文进行了基于UTF-8(基于页面的编码设置)的URL编码
- 当web server(tomcat)接收到该链接时,将会进行URL解码,即去掉"%",同时默认按照ISO8859-1编码进行解码
得到正确信息的方式有两种
- 更改tomcat配置,使其默认按照UTF-8对URL的特殊字符进行解码
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/>
- 在获取信息时进行如下操作
String text = new String(request.getParameter("name").getBytes("ISO8859-1"),"UTF-8");