《Python CookBook2》 第一章 文本 - 过滤字符串中不属于指定集合的字符 && 检查一个字符串是文本还是二进制
过滤字符串中不属于指定集合的字符
任务:
给定一个需要保留的字符串的集合,构建一个过滤函数,并可将其应用于任何字符串s,函数返回一个s的拷贝,该拷贝只包含指定字符集合中的元素。
解决方案:
import string allchars = string.maketrans('','') #all chars table def makefilter(keep): delchars = allchars.translate(allchars,keep) def thefilter(s): return s.translate(allchars,delchars)#delchars是要删除的字符串list内容 return thefilter if __name__ == "__main__": just_vowels = makefilter('aeiouy') print just_vowels('i love python') print just_vowels('wwwwwwwwww')
检查一个字符串是文本还是二进制
任务:
在 python中,普通字符串既可以容纳文本,也可以容纳任意的字节,现在需要探知一个字符串中的数据究竟是文本还是二进制。
解决方案:
from __future__ import division import string text_characters = ''.join(map(chr,range(32,127))) + '\n\t\r\b' _null_trans = string.maketrans('','') def istext(s,textcharacters = text_characters,threshold = 0.30): if '\0' in s: return False if not s: return True t = s.translate(_null_trans,text_characters) return len(t)/len(s) <= threshold print istext('1101111111')
目前还是不是很懂这个方法,代码的结构还是在学习适应中