java中字符与字节的编码关系

  • 在 GB 2312 编码或 GBK 编码中,一个英文字母字符存储需要1个字节,一个汉字字符存储需要2个字节。
    在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。
    在UTF-16编码中,一个英文字母字符或一个汉字字符存储 都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
    在UTF-32编码中,世界上任何字符的存储都需要4个字节。

  • java 默认使用Unicode编码(具体是UTF-16编码)


  • 出处:https://zhuanlan.zhihu.com/p/25435644

posted on 2017-09-02 15:09  cag2050  阅读(197)  评论(0编辑  收藏  举报

导航