python中英文字母和中文汉字所占的字节

print(type('李杰'.encode('utf-8')))#<class 'bytes'>
print(type('李杰'.encode('gbk')))#<class 'bytes'>
print(len('李杰'.encode('utf-8')))#6
print(len('李杰'.encode('gbk')))#4
print(len(',。'.encode('gbk')))#4

 英文和符号:

print(type('li'.encode('utf-8')))#<class 'bytes'>
print(type('li'.encode('gbk')))#<class 'bytes'>
print(len('li'.encode('utf-8')))#2
print(len('li'.encode('gbk')))#2
print(len(',.'.encode('gbk')))#2

  所以:

utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

 

posted @ 2020-04-13 21:27  飞鸟与新月  阅读(1415)  评论(0编辑  收藏  举报