java语言基础--字符编码
一、什么是字符编码?
- 字符编码是人为的定义的一套转换表。
- 在字符编码中规定了一系列的文字对应的二进制。
- 字符编码本质上就是一本字典,该字段中描述了字段与二进制之间的对照关系
- 字符编码是人为规定的(是某个计算机协会规定的。)
- 字符编码涉及到编码和解码两个过程,编码和解码的时候必须采用同一套字符编码方式,不然就会出现乱码。
二、发展
计算机最初只支持英文,最先出现的字符编码是:ASCII码
'a'-->97【01100001】
'A'-->65
'0'-->48(文字‘0’,不是那个0)
'1'-->49
'a' --(按照ASCII解码)-->01100001
01100001---按照ASCII编码-->'a'
支持西欧语言,编码方式:ISO-8859-1,又称Iatin-1(国标码 拉丁1)
支持中文、日文、韩文等文字,其中支持简体中文的编码方式是:GB2312 < GBK < GB18030(容量关系)
支持繁体中文:大五码Big5
java语言为了支持全球所有的文字,采用了一种字符编码方式,统一全球所有的文字:unicode
unicode编码有多种具体实现:
- UTF-8
- UTF-16
- UTF-32
....
实际开发中,一般用 UTF-8 编码方式较多。【统一编码方式】
java语言源代码采用的是Unicode编码方式,所以标识符可以用中文。
demo:
class 学生{
}