Python处理编码汉字的一些方法收集

# \x编码转换为汉字
python2:
str1='\xe6\xb6\xa6\xe4\xb9\x8b'
print unicode(str1,'utf-8')

python3:
str2=b'\xe6\xb6\xa6\xe4\xb9\x8b'
print(str2.decode())


# \u编码转换为汉字
python2:
str1='\u6da6\u4e4b'
print str1.decode('unicode_escape')

python3:
str2='\u6da6\u4e4b'
print(str2.encode('utf-8').decode('utf-8')) // .decode('unicode_escape') 这样不对
注:如果只是输出,直接 print(str2) 就能正确输出中文

 

# 生成编码(python 2/3 通用)

>>> u'润之'.encode('unicode_escape')
b'\\u6da6\\u4e4b'
>>> u'润之'.encode('utf-8')
b'\xe6\xb6\xa6\xe4\xb9\x8b'

 

posted @ 2020-10-06 18:09  润之  阅读(449)  评论(0编辑  收藏  举报