8月9日
JavaIO流的前置知识,字符集
标准ASCll字符集
ASCll:美国信息交换标准代码,包括了英文、符号等
标准ASCll使用1个字节存储字符,首位是0,总共128个字符。
GBK:汉字编码字符集,包含2万多汉字等字符,GBK中一个中文字符编码成两个字节形式储存
注意:GBK兼容了ASCll字符集
GBK规定:汉字的第一个字节的第一位必须是1
Unicode字符集(统一码,也叫万国码)
Unicode字符集是国际组织制定的,可以容纳世界上所有文字、符号的字符集
Unicode 4个字节表示一个字符
UTF-8是Unicode字符集的一种编码方案,采取可变长编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节
其中英文字符、数字等只占1个字节,汉字站3个