字符编码和字符集、编码引出的问题
字符编码和字符集
字符集只是一个规则集合的名字,字符集 = 字库表(character repertoire)、编码字符集(coded character set)、字符编码(character encoding form)。
编码字符集:(简称字符集,如Unicode、ASCII)
编码字符集,用一个编码值code point来表示一个字符(即该字符在子库表中的位置),这个值称为字符对应于编码字符集(如:Unicode、ASCII)的序号。
4、字符编码:
字符编码,是编码字符集和实际存储数值之间的转换关系。字符,是根据字符编码方案转换为一个二进制数值存储在计算机中的。
所以,字符编码是定义在字符集上的映射规则。(字符-------->计算机中的实际存储值)
注意:编码字符集Unicode,有UTF-8、UTF-16、UTF-32等多种字符编码
编码字符集ASCII,本身就是编码字符集,又是字符编码
编码字符集CB2312,只有EUC-CN一种字符编码
编码引出的问题
在Idea,使用FileReader,读取项目的文本文件,默认UTF-8
FileReader可以读取默认编码格式的文件
FileReader读取系统默认编码会产生乱码