Java中常见的几个乱码问题以及解决方法
1.ajax--URL中的参数含中文,后台接受的参数出现乱码
解决方法:
第一步:在javascript中,对url进行两次编码
url = "http://localhost:8080/MyData/SearchTopicServlet?topic="+topic;
url=encodeURI(url);
url=encodeURI(url);//记得一定是编码两次
第二步:在servlet中,对获取的参数进行解码
String topic=request.getParameter("topic");
topic = java.net.URLDecoder.decode(topic, "UTF-8");
2.servlet返回给ajax的中文乱码
解决方法:
在servlet中添加下面这一句话:
response.setContentType("text/xml;charset=utf-8");
3.TXT文件中含中文,读入以后,中文出现乱码
解决方法:
br=new BufferedReader(new InputStreamReader(new FileInputStream("E:\\encodeBook.txt"),"UTF-8"));
Java中文件读入,读取的编码原理:
Reader 类是 Java 的 I/O 中读字符的父类,而 InputStream 类是读字节的父类,InputStreamReader 类就是关联字节到字符的桥梁,它负责在 I/O 过程中处理读取字节到字符的转换,而具体字节到字符的解码实现它由 StreamDecoder 去实现,在 StreamDecoder 解码过程中必须由用户指定 Charset 编码格式。值得注意的是如果你没有指定 Charset,将使用本地环境中的默认字符集,例如在中文环境中将使用 GBK 编码.
Java的I/O类处理图
4.URL中的编码问题:
解决方法:
1 import java.net.URLDecoder; 2 3 import java.net.URLEncoder; 4 5 public class URLDecoderTest { 6 7 public static void main(String[] args) throws Exception { 8 9 //将application/x-www-form-urlencoded字符串 10 11 //转换成普通字符串 12 13 //必须强调的是编码方式必须正确,如baidu的是gb2312,而google的是UTF-8 14 15 String keyWord = URLDecoder.decode("%E6%96%87%E6%A1%A3", "gb2312"); 16 17 System.out.println(keyWord); 18 19 20 21 //将普通字符串转换成 22 23 //application/x-www-form-urlencoded字符串 24 25 //必须强调的是编码方式必须正确,如baidu的是gb2312,而google的是UTF-8 26 27 String urlStr = URLEncoder.encode("文档", "gb2312"); 28 29 System.out.println(urlStr); 30 31 } 32 33 }
原理:
1.application/x-www-form-urlencoded是一种编码类型。
这种类型会:
1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;
2.将空格转换为加号 (+) ;
3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;
4.在每个 name=value 对之间放置 & 符号。
2。网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,我们经常会在浏览器的地址栏里看到这样的字串%E6%96%87%E6%A1%A3,这就是被编码后的字符串。
3.UrlEncoder是将普通字符串转换成application/x-www-form-urlencoded字符串。
5.servlet中的乱码问题:
1.若接受到的字段为乱码:
缺少了这一句话:request.setCharacterEncoding("utf-8");
2.跳转后的页面出现乱码:
缺少了这一句话:response.setContentType("text/html");
并且session之前不可以有out 输出
6。JS动态给html页面赋值,出现乱码
js文件中出现这种给html页面动态添加内容时,添加内容若是中文,注意在jsp页面中设置编码,否则会出现乱码。
js中为:$('userpwd_error').innerHTML = "<img src='images/wrong.gif'>密码不能为空";
修改方法:
在jsp中如下设置:
1. <html>
2. <head>
3. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
4. <script type="text/javascript" src="text.js" charset="GB2312"></script>
5. </head>
6. <body>
7.
8. </body>
9. </html>
其实就是第二行charset惹的祸,第二行主要是设定了整个页面的字符编码方式,在此例中是UTF-8。
而在JS中是普通的GB2312或者是GBK编码方式。所以会产生乱码。注意第三行最后的charset=”GB2312″。
7.超链接传参,参数是中文时,后台接收的参数是乱码
在jsp中:
<% while(rs.next()){%> <tr> <td><%=rs.getInt(1)%></td> <td><%=rs.getString(2)%></td> <td><%=rs.getString(3)%></td> <td><%=rs.getString(4)%></td> <td> <a href="./user.jsp?id=<%=rs.getString(1)%>&username=<%=rs.getString(2)%>&password=<%=rs.getString(3)%>&authority=<%=rs.getString(4)%>"><i class="icon-pencil"></i></a> <a href="./../AdminDelUserServlet?id=<%=rs.getInt(1)%>" onclick="return confirm('确定删除该用户吗?')"><i class="icon-remove" ></i></a> </td> </tr> <%} %>
后台接收时如下设置,中文则不会出现乱码:
String id=request.getParameter("id"); String username=new String(request.getParameter("username").getBytes("ISO-8859-1"),"utf-8"); String password=request.getParameter("password"); String authority=request.getParameter("authority");