文本处理 - 字符串逐字符或逐单次反转

1. 使用切片逐字符反转字符串

1 >>> astring = 'uzero'
2 >>> revstring = astring[::-1]
3 >>> print revstring
4 orezu

2.使用内建函数reversed

1 >>> revstring = ''.join(reversed(astring))
2 >>> print revstring
3 orezu

内建函数reversed以序列作为参数,返回一个反转的可迭代对象,所以不得不以该迭代对象作为参数调用join将反转的字符拼接起来.在反转字符时,切片是最简单,最好的选择.

3. 使用切片逐单词反转字符串

显然,首先需要创建一个字符串包含单词的列表,然后对该列表进行切片即可:

1 >>> astring = 'one two three'
2 >>> wordsList = astring.split()
3 >>> revString = ' '.join(wordsList[::-1])

 一行代码搞定:

1 >>> revString = ' '.join(astring.split()[::-1])

如果想保留原先字符串中的空格而不是以' '.join产生空格的话,可以使用正则表达式分割单词:

1 >>> import re
2 >>> revwords = re.split(r'(\s+)', astring)
3 >>> print revwords
4 ['one', ' ', 'two', ' ', 'three']

\s+代表匹配任意空白符,re.split(r'\s+', astring)表示以任意空白符切分字符串astring,正则表达式部分加上(),表示捕获匹配\s+的字符串并将匹配的字符串添加到结果的列表中,可以看看正则表达式部分没有()的结果:

1 >>> import re
2 >>> revwords = re.split(r'\s+', astring)
3 >>> print revwords
4 ['one', 'two', 'three']

可以看出正则表达式部分没有()的话,re.slipt退化成string类的split方法。然后调用''.join(revwords)将反转的单词拼接起来:

1 >>> revstring = ''.join(revwords[::-1])
2 >>> print revstring
3 three two one

也可以用一行代码搞定:

1 >>> revstring = ''.join(re.split(r'(\s+)', astring)[::-1])
2 >>> print revstring
3 three two one

这样的代码格式有点复杂,不是好的python代码。

4. 使用内建函数reversed

1 >>> revstring = ''.join(reversed(re.split(r'(\s+)', astring)))
2 >>> print revstring
3 three two one

这样比使用切片的一行代码要简洁的多,主要是切片[::-1]放在一行代码中不好阅读。

posted @ 2013-01-24 11:11  uzero  阅读(284)  评论(0编辑  收藏  举报