UTF-8编码

UTF-8编码是Unicode编码的一种实现

Unicode编码的出现是为了规定不同语言字符和二进制位之间的表示关系

最熟知的编码是ASCII码，是美国制定的表示英文字符和二进制位之间关系的编码，使用一个字节即八位，理论上可以表示256种字符。ASCII码规定了128个字符的编码，最前面的一位规定为0，只占用一个字节的后面7位。

Unicode试图建立一种全编码来表示世界上的所有字符，使用四个字节来规定世界上所有字符和二进制位之间的关系，但是因为不同字符需要的二进制表示位数不同的原因，有的需要四个字节来表示，而有的只需要一个字节表示即可（如英文字符），所以造成了存储空间的极大浪费，所以一种变长的编码方式UTF-8出现了

UTF-8 最大的一个特点，就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。

参考文章：ASCII,Unicode和UTF-8

posted @ 2022-05-03 20:22 EEvinci 阅读(77) 评论(0) 收藏举报

刷新页面返回顶部

Loading

Evinci's Blog

UTF-8编码

UTF-8编码

公告