使用gson在解析unicode时遇到的问题

之前在用gson解析的时候未记录下来，所以今天做一个小的总结，

比如遇到像这种"\u003d"的unicode的字符，我们想解码这个字符，用gson可以这样表达

Gson gson=new Gson();
        String s2 = "\"{\\\"hi\\\":\\\"\\u003d\\\"}\"";
        System.out.println("s2:"+s2);
        String s = gson.fromJson(s2, String.class);
        System.out.println(s);

上面的输出结果为

s2:"{\"hi\":\"\u003d\"}"

{"hi":"="}

可见传入到json中的字符串必须是带转义字符的，且格式必须是正确的，否则会出错，

同样的，解码一个unicode字符也可以使用URLDecoder，这个对unicode的直接解析比较方便。

代码如下：

	String ss = URLDecoder.decode("\u003d","utf-8");
		System.out.println(ss);

　　上面的代码输出如下：

该方法较上一种方便很多。

另外利用gson转换成json字符串的时候会自动编码特殊字符，如果要忽略此功能，则使用

new GsonBuilder().disableHtmlEscaping().create()

创建gson对象即可。

------------------------------------------------------------------------------------------------------

此处分割线，楼主最近又发现一个奇怪的问题，上面的URLDecoder中传入的如果是这种字面量，他是可以解析的，其实直接用java的println打出来也是中文，但是如果不是这种字面量，那问题就比较麻烦了，因为即使是一样的字符串，他也是不能解码的，，后来楼主在网上的一片博客中找到了另一种方法，即使用org.apache.commons.lang.StringEscapeUtils#unescapeJava(String) 这是使用apache提供的包里的工具，如果你的工程里没有引用这个，也不用担心，原博客提供了另外一种方法，此处贴上博客地址，http://blog.csdn.net/djun100/article/details/12128057 他好像也是转的，，，所以就找不到原作者了，，，，

posted on 2016-01-07 15:46 net_程序猿阅读(2855) 评论(0) 收藏举报

刷新页面返回顶部

net_程序猿

导航

公告

使用gson在解析unicode时遇到的问题