南苑~春波

导航

 

编码和解码

编解码其实就是一种映射关系

编码

真实字符与二进制串的对应关系。真实字符二进制串

解码

二进制串与真实字符的对应关系。二进制串真实字符

常见编码方式:

编码 不支持类型 支持类型 大小
ASCII码 不支持中文 英文、数字、符号 1byte
GBK(国标) 其他语种 中文、英文、数字、符号 英文 16bit 2byte 中文16bit 2byte
Unicode 万国码 中文、英文、数字、符号 最少 1byte 英文  32bity 4byte 中文 32bit  4byte
UTF-8 长度可变的万国码 全部 英文  8bit 1byte 中文 24bit   3byte

编解码方式

encode(编码方式)

  • 拿到明文编码后对应的字节

decode()

  • 将编码后的字节解码成对应的明文
    注意:
  • 编码和解码应该保持同一个码,否则会报错:UnicodeDecodeError
  • 一般项目会在文件开头指定编码格式,

参考:
https://blog.csdn.net/qq_44401643/article/details/96362698

posted on 2019-07-17 21:04  南苑~春波  阅读(135)  评论(0编辑  收藏  举报