char类型长度

char是两个字节!相信自己没有错

在《java虚拟机规范》一文中指出,char类型是两个字节。但是我们的程序无论用什么方式获取都无法获取到正确的数据类型,原因如下:

1.如果程序代码是String testStr=new String("c"),,,,等等使用String来作为中间解析的,不正确,因为java编码分为内码和外码。什么是内码呢?就是java程序在运行时使用的编码;外码就是对外表现的编码。char类型在java运行时使用的是utf-16编码,使用两个字节。但是你却用String来接,String的外码是需要指定的,如果不指定就是jvm默认编码,一般为gbk,所以肯定是不正确的。

2.又有人说了,utf-16即使作为内码,但也是变长的,长度为两个字节或者四个字节。我只想说,你说得对。在utf-16编码的早期,该编码方式是定长的(2字节),但由于后来扛不住越来越多的字符,所以扩展到了4个字节。注意:是扩展到,没有3字节的utf-16。然而java出来的时候比较早,那个时候utf-16还是定长编码,后来改了,没办法java为了做适配,就改用两个char(敲黑板)来表示一个字符。

 

所以说,jvm中char在运行时表现的确实是两个字节。但是当char参与运算的时候,会被转为int(不仅是char,byte、short也都会被转),所以此时是4个字节,运算完成后又被转存成了两个字节。

posted @ 2017-12-18 14:14  akgang  阅读(8156)  评论(0编辑  收藏  举报