python中英文字母和中文汉字所占的字节
print(type('李杰'.encode('utf-8')))#<class 'bytes'> print(type('李杰'.encode('gbk')))#<class 'bytes'> print(len('李杰'.encode('utf-8')))#6 print(len('李杰'.encode('gbk')))#4 print(len(',。'.encode('gbk')))#4
英文和符号:
print(type('li'.encode('utf-8')))#<class 'bytes'> print(type('li'.encode('gbk')))#<class 'bytes'> print(len('li'.encode('utf-8')))#2 print(len('li'.encode('gbk')))#2 print(len(',.'.encode('gbk')))#2
所以:
utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。