原因:
计算机中只存在0、1字节数据,不同的语言需要用0或1进行不同的组成,这就是编码。
那么在编码后就需要解码,要想显示正确的内容,编码和解码就需要进行对应,如果编码和解码不对应则会出现乱码。
那么在实际的开发之中对于常用的编码有如下几种:
- GBK/GB2312: 国标编码,可以描述中文信息,其中GB2312只描述简体中文,GBK既描述简体中文又描述繁体中文。
- ISO8859-1: 国际通用编码,可以用其描述所有的字母信息,如果是象形文字则需要进行编码处理。
- UNICODE编码: 采用十六进制的方式存储,可以描述所有的文字信息。
- UTF编码: 象形文字部分使用十六进制编码,而普通的字母采用的是 ISO8859-1编码,它的优势在于快速传输,节约带宽,也就成为了在开发之中首选的编码,主要使用“UTF-8”的编码。
输出查看本机属性:
public class MAIN {
public static void main(String[] args) {
System.getProperties().list(System.out);
}
}
可以看到文件默认编码为UTF-8。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)