Python中编码问题:u'\xe6\x97\xa0\xe5\x90\x8d' 类型和 ‘\u559c\u6b22\u4e00\u4e2a\u4eba ’ 转为utf-8的解决办法
相信小伙伴们遇到过类似这样的问题,python2中各种头疼的转码,类似u'\xe6\x97\xa0\xe5\x90\x8d' 的编码,直接s.decode()是无法解决编码问题。尝试了无数办法,都无法解决。
最终得到完美的解决办法:
s = u'\xe6\x97\xa0\xe5\x90\x8d'
s2 = s.encode('raw_unicode_escape')
print s2 ---->无名
完美解决。
>>> s3 = ‘\u559c\u6b22\u4e00\u4e2a\u4eba’
>>> s4 = s3.decode('unicode-scape')
>>> s4
u ‘\u559c\u6b22\u4e00\u4e2a\u4eba’
>>> print s4
喜欢一个人