摘要: 今天工作中又一次遇到了java字符集问题,这次是由getBytes方法导致的。以前的时候,曾经很多次的解决过java字符集以及乱码的问题,以为对这块很了解了,至到今天的又一次深入的学习,才发现以前的认识当中存在的问题,下次就getBytes方法在应用级别进行比较实际的解释。1、Unicode是一种编码规范,是为解决全球字符通用编码而设计的,而rUTF-8,UTF-16等是这种规范的一种实现。2、java内部采用Unicode编码规范,也就是支持多语言的,具体采用的UTF-16编码方式。3、不管程序过程中用到了gbk,iso8859-1等格式,在存储与传递的过程中实际传递的都是Unicode编码 阅读全文
posted @ 2013-09-07 13:11 tse johnson 阅读(582) 评论(0) 推荐(0) 编辑
摘要: JAVA源文件-->JAVAC-->Class-->Java-->getBytes()-->new String()-->显示的过程中,每一步都有编码的转换过程,这个过程总是存在的,只是有的时候用默认的参数进行。 1. JAVAC是以系统默认编码读入源文件,然后按UNICODE进行编码的。可以通过指定编码方式改变Javac读入源文件的编码方式。Java代码javac-encodingGBKTest.java 2. 在JAVA运行的时候,JAVA也是采用UNICODE编码的,并且默认输入和输出的都是操作系统的默认编码。 也就是说在new String(byte 阅读全文
posted @ 2013-09-07 13:08 tse johnson 阅读(2850) 评论(0) 推荐(0) 编辑