常见字符编码
在程序中如果没有处理好,就有可能出现乱码问题。下面我们一起为大家介绍在开发中常见的编码有哪些。
在计算机世界里,任何的文字都是以指定的编码方式存在的。
常见的编码:ISO8856-1、GBK/GB2312、unicode、UTF。
ISO8856-1:
属于单字节编码,最多只能表示0-255的字符范围,主要在英文上应用
GBK/GB2312:
中文的国际编码,专门用来表示汉子,是双字节编码
unicode:
java中用的就是此编码方式,也是最标准的一种编码,使用16进制表示的编码,但此编码不兼容ISO8856-1
UTF:
由于unicode不兼容ISO8856-1,而且容易占用更多空间,而且对于英文也需要两个字符编码表示,这样使得unicode不便于传输和存储,所以产生了UTF编码,此编码兼容了ISO8856-1,也可以用来表示所有语言祝福,不过UFT是不定长编码,每个字符的长度从1-6个字节不等,一般在中文网页中使用此编码,因为这样可以节省空间。
造成乱码的根本原因:
1、程序中使用的编码与本机编码不一致
2、网络中,客户端与服务端编码不统一
代码:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!