Python处理编码汉字的一些方法收集
# \x编码转换为汉字
python2:
str1='\xe6\xb6\xa6\xe4\xb9\x8b'
print unicode(str1,'utf-8')
python3:
str2=b'\xe6\xb6\xa6\xe4\xb9\x8b'
print(str2.decode())
# \u编码转换为汉字
python2:
str1='\u6da6\u4e4b'
print str1.decode('unicode_escape')
python3:
str2='\u6da6\u4e4b'
print(str2.encode('utf-8').decode('utf-8')) // .decode('unicode_escape') 这样不对
注:如果只是输出,直接 print(str2) 就能正确输出中文
# 生成编码(python 2/3 通用)
>>> u'润之'.encode('unicode_escape')
b'\\u6da6\\u4e4b'
>>> u'润之'.encode('utf-8')
b'\xe6\xb6\xa6\xe4\xb9\x8b'
✉ ext2@qq.com