python之编码decode
ASCII
8位 一个字节 表示 比如A : 00000010
Unicode
32位 4个字节 表示 比如A:00000000 00000001 00000010 00000100
中文也是32位
utf-8 8 位一个字节表示 比如 A:00100000
中文24位3个字节 : 0000001 00000000 00000000
gbk 英文 8位 一个字节
中文 16位 两个字节
1.各个编码之间的二进制,是不能互相识别的,会产生乱码。
2.文件的储存,传输,不能是unicode(只能是utf-8 utf-16 gbk gb2312 ASCII)
python3的str,在内存中是用Unicode编码的。
bytes类型
对于英文:str : 表现形式:s=‘alex’
编码方式:01010101 unicode
bytes:表现形式: s=b’alex’
编码方式:01010101 gbk utf-8等等
对于中文:str: 表现形式:'中国'
编码形式:01010101 Unicode
bytes:表现形式:b'x\e97\e91\e21\e21\e32\e15
编码形式:
encode 编码
将Unicode转换成utf-8或者gbk
将str--》bytes:s11=s1.encode(‘utf-8’)
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步