编码和解码
编解码其实就是一种映射关系
编码
真实字符与二进制串的对应关系。真实字符二进制串
解码
二进制串与真实字符的对应关系。二进制串真实字符
常见编码方式:
编码 | 不支持类型 | 支持类型 | 大小 |
---|---|---|---|
ASCII码 | 不支持中文 | 英文、数字、符号 | 1byte |
GBK(国标) | 其他语种 | 中文、英文、数字、符号 | 英文 16bit 2byte 中文16bit 2byte |
Unicode 万国码 | 中文、英文、数字、符号 | 最少 1byte 英文 32bity 4byte 中文 32bit 4byte | |
UTF-8 长度可变的万国码 | 全部 | 英文 8bit 1byte 中文 24bit 3byte |
编解码方式
encode(编码方式)
- 拿到明文编码后对应的字节
decode()
- 将编码后的字节解码成对应的明文
注意: - 编码和解码应该保持同一个码,否则会报错:UnicodeDecodeError
- 一般项目会在文件开头指定编码格式,
参考:
https://blog.csdn.net/qq_44401643/article/details/96362698