【python cookbook】python过滤字符串中不属于指定集合的字符
1 #!/usr/bin/python 2 # -*- coding: utf-8 -*- 3 4 #过滤字符串中不属于指定集合的字符 5 6 import string 7 8 # 生成所有字符的可复用的字符串 它还可以作为一个翻译表 指明无需翻译 9 allchars = string.maketrans('','') 10 11 12 def makefilter(keep): 13 """返回一个函数 此函数接受一个字符串为参数 14 并返回字符串的一个部分拷贝 15 次拷贝纸包含在keep中的字符 keep必须是一个普通字符""" 16 17 #生成一个由所有不再keep中的字符组成的字符串:keep的补集 即要删除的字符串 18 delchars= allchars.translate(allchars,keep) 19 #生成并返回需要过滤的函数(作为闭包) 20 21 def thefilter(s): 22 return s.translate(allchars,delchars) 23 return thefilter 24 25 if __name__ == '__main__': 26 just_vowels = makefilter('aeiouy') 27 print just_vowels('four score and seven years ago')
输出 ouoeaeeyeaao
但此代码的缺陷为只适用于普通字符 对于unicode字符不适用
unicode字符串的translate方法只需要一个参数 (一个序列活着一个映射) 并且根据字符串的码值进行索引
通常 使用dict 或着list 作为unicode 字符串的translate 方法参数,来翻译或者删除某些字符
但我们可以使用更好的办法 --编写一个简单的实现
import sets class Keeper(obj): def __init__(self,keep): self.keep = sets.Set(map(ord,keep)) def __getitem__(self,n): if n not in self.keep: return None return unichr(n) def __call___(self,s): return unicode(s).translate(self) makefilter = Keeper if __name__ == '__main__': just_vowels = makefilter('aeiouy') print just_vowels(u'four score and seven years ago')
u'four score and seven years ago'.translate(['a','e','i','o','u','y'])
map(function, iterable, ...)
Apply function to every item of iterable and return a list of the results. If additional iterable arguments are passed, function must take that many arguments and is applied to the items from all iterables in parallel. If one iterable is shorter than another it is assumed to be extended with None items. If function is None, the identity function is assumed; if there are multiple arguments, map() returns a list consisting of tuples containing the corresponding items from all iterables (a kind of transpose operation). The iterable arguments may be a sequence or any iterable object; the result is always a list.
>>> ls = [1,2,3,4] >>> print map(lambda x:x*3,ls) [3, 6, 9, 12]
ord() jie接受长度为一的unicode字符串为参数 返回unicode码值
>>> print ord('a') 97
"双下划线" 开始的是私有成员,意思是只有类对象自己能访问,连子类对象也不能访问到这个数据。
方法在类的一个对象被建立时,马上运行。这个方法可以用来对你的对象做一些你希望的 初始化 。注意,这个名称的开始和结尾都是双下划线。
换句话说,我们可以把这个类型的对象当作函数来使用,相当于 重载了括号运算符。
作者:GoodSpeed Cheng