UTF-8编码
UTF-8编码
UTF-8编码是Unicode编码的一种实现
Unicode编码的出现是为了规定不同语言字符和二进制位之间的表示关系
最熟知的编码是ASCII码,是美国制定的表示英文字符和二进制位之间关系的编码,使用一个字节即八位,理论上可以表示256种字符。ASCII码规定了128个字符的编码,最前面的一位规定为0,只占用一个字节的后面7位。
Unicode试图建立一种全编码来表示世界上的所有字符,使用四个字节来规定世界上所有字符和二进制位之间的关系,但是因为不同字符需要的二进制表示位数不同的原因,有的需要四个字节来表示,而有的只需要一个字节表示即可(如英文字符),所以造成了存储空间的极大浪费,所以一种变长的编码方式UTF-8出现了
UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。
作者:Evinci
出处:https://www.cnblogs.com/evinci/p/17123975.html
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
Buy me a cup of coffee ☕.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)