java 编码转换
在网络中爬取到的数据,编码可能与当前编译器的编码不相同,而导致可能产生显示乱码的问题。那么如何将网络的编码,转换为当前编译器认可的编码(一般为UTF-8),就是个问题了。
主要使用了两个方法:
String.getBytes("编码类型"):表示将String编码转换成相应的编码。
String.getBytes():表示转换成操作系统默认的编码。
String.getBytes("utf-8"):表示将String转换成UTF-8编码。
最后使用:
new String(str,"UTF-8");表示该str以什么编码方式显示。
所以将一个GBK编码的string转换成UTF-8的步骤是:
String str = "你好" //gbk
String str = new String(str.getBytes("utf-8"),"utf-8");//就转换过来了
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步