字符编码和字符集、编码引出的问题
字符编码和字符集
字符集只是一个规则集合的名字,字符集 = 字库表(character repertoire)、编码字符集(coded character set)、字符编码(character encoding form)。
编码字符集:(简称字符集,如Unicode、ASCII)
编码字符集,用一个编码值code point来表示一个字符(即该字符在子库表中的位置),这个值称为字符对应于编码字符集(如:Unicode、ASCII)的序号。
4、字符编码:
字符编码,是编码字符集和实际存储数值之间的转换关系。字符,是根据字符编码方案转换为一个二进制数值存储在计算机中的。
所以,字符编码是定义在字符集上的映射规则。(字符-------->计算机中的实际存储值)
注意:编码字符集Unicode,有UTF-8、UTF-16、UTF-32等多种字符编码
编码字符集ASCII,本身就是编码字符集,又是字符编码
编码字符集CB2312,只有EUC-CN一种字符编码
编码引出的问题
在Idea,使用FileReader,读取项目的文本文件,默认UTF-8
FileReader可以读取默认编码格式的文件
FileReader读取系统默认编码会产生乱码
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY