文本编码解释
一张图解释字符集
举例说明什么是编码:
UTF-8编码
等长编码对于英文来说浪费空间,所以出现了变长编码UTF系列,如UTF8,UTF16,UTF32。
UTF8的编码对象是整个Unicode字符集,所以可以表示所有国家的语言而不会乱码,所以叫“万国码”。所以网络传输文本一般使用UTF-8编码,如网页,这样可以在不同的电脑上看到相同的文本而不乱码。
GB2312编码
但是UTF8还是对于英文来说,还是单个字节,但是对于其他语言编码还是多个字节,占用空间仍然较大。
如果只针对中文进行编码,被编码文字只有几万字,那么会节省很多空间。常用的简体中文编码有GBK/GB2312,GB表示国家标准。虽然节省的存储空间,但是前提是需要知道文本的语言是什么。所以只在中文环境下使用。
- 完
本文来自博客园,作者:撬动未来的支点,转载请注明原文链接:https://www.cnblogs.com/pivotfuture/p/16297432.html
CSDN:撬动未来的支点,公众号:Qt未来工程师,网站:www.qtfuture.cn
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!