8月9日

JavaIO流的前置知识,字符集

标准ASCll字符集

ASCll:美国信息交换标准代码,包括了英文、符号等

标准ASCll使用1个字节存储字符,首位是0,总共128个字符。

GBK:汉字编码字符集,包含2万多汉字等字符,GBK中一个中文字符编码成两个字节形式储存

注意:GBK兼容了ASCll字符集

GBK规定:汉字的第一个字节的第一位必须是1

Unicode字符集(统一码,也叫万国码)

Unicode字符集是国际组织制定的,可以容纳世界上所有文字、符号的字符集

Unicode 4个字节表示一个字符

UTF-8是Unicode字符集的一种编码方案,采取可变长编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节

其中英文字符、数字等只占1个字节,汉字站3个

posted @ 2023-08-12 20:12  umiQa  阅读(50)  评论(0编辑  收藏  举报