文本编码解释

 


一张图解释字符集

在这里插入图片描述


举例说明什么是编码:

UTF-8编码
等长编码对于英文来说浪费空间,所以出现了变长编码UTF系列,如UTF8,UTF16,UTF32。
UTF8的编码对象是整个Unicode字符集,所以可以表示所有国家的语言而不会乱码,所以叫“万国码”。所以网络传输文本一般使用UTF-8编码,如网页,这样可以在不同的电脑上看到相同的文本而不乱码。

GB2312编码
但是UTF8还是对于英文来说,还是单个字节,但是对于其他语言编码还是多个字节,占用空间仍然较大。
如果只针对中文进行编码,被编码文字只有几万字,那么会节省很多空间。常用的简体中文编码有GBK/GB2312,GB表示国家标准。虽然节省的存储空间,但是前提是需要知道文本的语言是什么。所以只在中文环境下使用。


posted @   撬动未来的支点  阅读(65)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示