python chr()、unichr()和ord()

chr()、unichr()和ord()

chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。unichr()跟它一样,只不过返回的是Unicode字符,这个从Python 2.0才加入的unichr()的参数范围依赖于你的Python是如何被编译的。如果是配置为USC2的Unicode,那么它的允许范围就是range(65536)或0x0000-0xFFFF;如果配置为UCS4,那么这个值应该是range(1114112)或0x000000-0x110000。如果提供的参数不在允许的范围内,则会报一个ValueError的异常。

ord()函数是chr()函数(对于8位的ASCII字符串)或unichr()函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的ASCII数值,或者Unicode数值,如果所给的Unicode字符超出了你的Python定义范围,则会引发一个TypeError的异常。

>>> chr(50)

'2'

>>> ord('f')

102

>>> unichr(20013)

u'\u4e2d'

>>> print unichr(20013)

>>> chr(20013)

Traceback (most recent call last):

File "<stdin>", line 1, in ?

chr(20013)

ValueError: chr() arg not in range(256)

>>> ord(u'\u4e2d')

Traceback (most recent call last):

File "<stdin>", line 1, in ?

ord(u'\u4e2d')

TypeError: ord() expected a character, but string of length 2 found

>>> ord(u'\u2345')

9029

 当所有的编码格式都无法通过时,可以使用unichr(ord(单个字符)).encode('utf-8')来进行编码,输出的一定是个utf-8。

posted @ 2013-05-23 10:35  网恋被骗5元  阅读(761)  评论(1编辑  收藏  举报