字符编码和字符集、编码引出的问题

字符编码和字符集

字符集只是一个规则集合的名字,字符集 = 字库表(character repertoire)、编码字符集(coded character set)、字符编码(character encoding form)。

编码字符集:(简称字符集,如Unicode、ASCII)
编码字符集,用一个编码值code point来表示一个字符(即该字符在子库表中的位置),这个值称为字符对应于编码字符集(如:Unicode、ASCII)的序号。
4、字符编码:
字符编码,是编码字符集和实际存储数值之间的转换关系。字符,是根据字符编码方案转换为一个二进制数值存储在计算机中的。
所以,字符编码是定义在字符集上的映射规则。(字符-------->计算机中的实际存储值)

注意:编码字符集Unicode,有UTF-8、UTF-16、UTF-32等多种字符编码
编码字符集ASCII,本身就是编码字符集,又是字符编码
编码字符集CB2312,只有EUC-CN一种字符编码
 

编码引出的问题

  在Idea,使用FileReader,读取项目的文本文件,默认UTF-8

  

 

 

 

FileReader可以读取默认编码格式的文件

FileReader读取系统默认编码会产生乱码

 

posted @   一位程序袁  阅读(29)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
点击右上角即可分享
微信分享提示