写这篇文章的是一位外国人,他遇到了什么问题呢?比如有一个 Unicode 字符串他需要转为 ascii码:

>>> title = u"Klüft skräms inför på fédéral électoral große"
>>> print title.encode(‘ascii’,'ignore’)
Klft skrms infr p fdral lectoral groe

可以看到丢了许多的字符。那么他在探求有没有一个好的方法,可以把类 Ascii 码的字符转为相应的 ascii 码呢?我的确在邮件列表中好象注意到有这么一封邮件。结果他找到方法了:

>>> import unicodedata >>> unicodedata.normalize('NFKD', title).encode('ascii','ignore') 'Kluft skrams infor pa federal electoral groe'

可以看到输出结果非常好。

posted on 2015-06-05 15:36  知识天地  阅读(1564)  评论(0编辑  收藏  举报