Java Unicode编码系统

Unicode是一种通用的国际标准字符编码,能够表示世界上大多数的书面语言。

为什么java使用Unicode系统?

Unicode之前,有很多语言标准:

  • ASCII (美国信息交换标准代码)。
  • ISO 8859-1 用于表示西欧语言。
  • KOI-8 用于表示俄文。
  • GB18030BIG-5 用于表示中文等等。

问题

这导致两个问题:

  1. 指定代码值对应于各种语言标准中的不同字母。
  2. 具有大字符集的语言的编码具有可变长度。一些常见字符被编码为单字节,其他需要两个或多个字节。

解决办法

为了解决这些问题,开发了一种新的语言标准,即Unicode系统。在unicode中,每个字符保存为2个字节,因此java也使用2个字节的字符。

最小值: \u0000
最高值: \uFFFF

 





posted @   cnetsa  阅读(47)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示