Python:内置函数makestrans()、translate()
转于:https://blog.csdn.net/u014351782/article/details/46740297
博主:夜-feng
一、makestrans()
格式: str.maketrans(intab, outtab);
功能:用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,
第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
注:两个字符串的长度必须相同,为一一对应的关系。
注:Python3.6中已经没有string.maketrans()了,取而代之的是内建函数:
bytearray.maketrans()、bytes.maketrans()、str.maketrans()
intab = 'abcd' outtab = '1234' #用str.maketrans()函数,将intab的字符转换为outtab的字符; str_trantab = str.maketrans(intab,outtab) print(str_trantab, type(str_trantab)) #输出:{97: 49, 98: 50, 99: 51, 100: 52} <class 'dict'> test_str = 'csdn blog: http://blog.csdn.net/wirelessqa' #使用translate()函数,对test_str文件进行加密,按转换表str_transtab print (test_str.translate(str_trantab)) #输出:3s4n 2log: http://2log.3s4n.net/wirelessq1
二、translate()
功能:
1)根据参数table给出的映射表表(包含 256 个字符),转换字符串的字符;
2)根据 [, dele] 内的字符集,删除字符串中对应的字符。
语法:
str.translate(table[, deletechars]); #对字符串操作
bytes.translate(table[, delete]) #对字节操作
bytearray.translate(table[, delete]) #对数组操作
例:
print(b'http://ww/w.csdn.net/wirelessqa'.translate(None, b'ts')) #输出:b'hp://www.cdn.ne/wireleqa' #使用bytes.maketrans()函数,得到映射表; #字符串前必须加:b,不然报错:translate() takes exactly one argument (2 given),即translate只能接受一个参数 bytes_tabtrans = bytes.maketrans(b'abcdefghijklmnopqrstuvwxyz', b'ABCDEFGHIJKLMNOPQRSTUVWXYZ') print(bytes_tabtrans) #输出:b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`ABCDEFGHIJKLMNOPQRSTUVWXYZ{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'
#bytes_tabtrans为一个bytes类型的映射表 print(type(bytes_tabtrans)) #输出:<class 'bytes'> print(b'http://www.csdn.net/wirelessqa'.translate(bytes_tabtrans, b'ts')) #输出:b'HP://WWW.CDN.NE/WIRELEQA'
三、闭包
思路:将一个函数函数2封装在函数1中,通过函数1将函数2返回;
#闭包应用举例 def corue(): a = 10 def corue_cuent(x): return a * x * x return corue_cuent #调用函数corue()后,将函数corue_cuent()返回给变量f; f = corue() print(f(2)) #输出:40
四、对translate()函数的简单封装,使用起来更加方便
实例应用:
#frm:intab #to:outtab #delete:指定删除字符 #keep:指定保留字符 #delete和keep有重叠时,delete优先 def my_translator(frm = b'', to = b'', delete = b'', keep = None): #如果to只有一个字符,将字符的数量跟frm相等,这样才能一一对应 if len(to) == 1: to = to * len(frm) #构建一个映射表 trans = bytes.maketrans(frm, to) #如果有保留字 if keep is not None: allchars = bytes.maketrans(b'', b'') #获取空映射表的所有字符 keep = keep.translate(allchars, delete) #从keep中去除delete中包含的字符,即keep与delete有重合时,优先考虑delete delete = allchars.translate(allchars, keep) #delete为从全体字符中除去keep,即不在keep的都删掉 # 闭包:即在函数my_translator()内部返回函数my_translate() def my_translate(s): return s.translate(trans, delete) return my_translate #测试my_tranlator #A、只保留数字 digits_only = my_translator(keep = b'0123456789') print(digits_only(b'http://www.csdn.net/wirelessqa 520520')) #输出:b'520520' #B、删除所有数字 no_digits = my_translator(delete = b'0123456789') print(no_digits(b'http://www.csdn.net/wirelessqa 520520')) #输出:b'http://www.csdn.net/wirelessqa' #C、用*替换数字 digits_to_hash = my_translator(frm = b'0123456789', to = b'*') print(digits_to_hash(b'http://www.csdn.net/wirelessqa 520520')) #输出:b'http://www.csdn.net/wirelessqa ******' #D、delete与keep有重合时的情况 trans = my_translator(delete = b'20', keep = b'0123456789') print(trans(b'http://www.csdn.net/wirelessqa 520520')) #输出:b'55'
五、unicode.translate()
功能:#待完善。。。
#去掉字符的重音符,重音符可以理解为中文的拼音的音标;
#将unicode的代码点(u751F),转换为汉字;
a = '\\u751F\\u5316\\u5371\\u673A' #'utf-8':表示? print (a.encode('utf-8').decode('unicode_escape')) #输出:生化危机