Python:内置函数makestrans()、translate()

转于:https://blog.csdn.net/u014351782/article/details/46740297

博主夜-feng

一、makestrans()

格式: str.maketrans(intab, outtab); 

功能:用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式, 

第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 

:两个字符串的长度必须相同,为一一对应的关系。 

Python3.6中已经没有string.maketrans()了,取而代之的是内建函数: 

bytearray.maketrans()、bytes.maketrans()、str.maketrans()

intab = 'abcd'
outtab = '1234' 
#用str.maketrans()函数,将intab的字符转换为outtab的字符;
str_trantab = str.maketrans(intab,outtab)
print(str_trantab, type(str_trantab))
#输出:{97: 49, 98: 50, 99: 51, 100: 52}  <class 'dict'>

test_str = 'csdn blog: http://blog.csdn.net/wirelessqa'
#使用translate()函数,对test_str文件进行加密,按转换表str_transtab
print (test_str.translate(str_trantab))
#输出:3s4n 2log: http://2log.3s4n.net/wirelessq1

 

二、translate()

功能:

1)根据参数table给出的映射表表(包含 256 个字符),转换字符串的字符;

2)根据 [, dele] 内的字符集,删除字符串中对应的字符。 

语法

str.translate(table[, deletechars]);  #对字符串操作

bytes.translate(table[, delete])    #对字节操作

bytearray.translate(table[, delete])   #对数组操作

print(b'http://ww/w.csdn.net/wirelessqa'.translate(None, b'ts'))
#输出:b'hp://www.cdn.ne/wireleqa'

#使用bytes.maketrans()函数,得到映射表;
#字符串前必须加:b,不然报错:translate() takes exactly one argument (2 given),即translate只能接受一个参数
bytes_tabtrans = bytes.maketrans(b'abcdefghijklmnopqrstuvwxyz', b'ABCDEFGHIJKLMNOPQRSTUVWXYZ')
print(bytes_tabtrans)
#输出:b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`ABCDEFGHIJKLMNOPQRSTUVWXYZ{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'

#
bytes_tabtrans为一个bytes类型的映射表 print(type(bytes_tabtrans)) #输出:<class 'bytes'> print(b'http://www.csdn.net/wirelessqa'.translate(bytes_tabtrans, b'ts')) #输出:b'HP://WWW.CDN.NE/WIRELEQA'

 

三、闭包

思路:将一个函数函数2封装在函数1中,通过函数1将函数2返回;

#闭包应用举例

def corue():
    a = 10

    def corue_cuent(x):
        return a * x * x

    return corue_cuent

#调用函数corue()后,将函数corue_cuent()返回给变量f;
f = corue()
print(f(2))
#输出:40

 

四、对translate()函数的简单封装,使用起来更加方便

实例应用:

#frm:intab
#to:outtab
#delete:指定删除字符
#keep:指定保留字符
#delete和keep有重叠时,delete优先

def my_translator(frm = b'', to = b'', delete = b'', keep = None):

    #如果to只有一个字符,将字符的数量跟frm相等,这样才能一一对应
    if len(to) == 1:   
        to = to * len(frm) 
            
    #构建一个映射表    
    trans = bytes.maketrans(frm, to)

    #如果有保留字
    if keep is not None:
        allchars = bytes.maketrans(b'', b'')
        #获取空映射表的所有字符  
        keep = keep.translate(allchars, delete)
        #从keep中去除delete中包含的字符,即keep与delete有重合时,优先考虑delete
        delete = allchars.translate(allchars, keep)
        #delete为从全体字符中除去keep,即不在keep的都删掉
          
    # 闭包:即在函数my_translator()内部返回函数my_translate()
    def my_translate(s):    
        return s.translate(trans, delete)
    
    return my_translate    
    
#测试my_tranlator  
    
#A、只保留数字    
digits_only = my_translator(keep = b'0123456789')    
print(digits_only(b'http://www.csdn.net/wirelessqa 520520'))
#输出:b'520520'

#B、删除所有数字
no_digits = my_translator(delete = b'0123456789')
print(no_digits(b'http://www.csdn.net/wirelessqa 520520'))
#输出:b'http://www.csdn.net/wirelessqa'

#C、用*替换数字
digits_to_hash = my_translator(frm = b'0123456789', to = b'*')    
print(digits_to_hash(b'http://www.csdn.net/wirelessqa 520520'))
#输出:b'http://www.csdn.net/wirelessqa ******'

#D、delete与keep有重合时的情况
trans = my_translator(delete = b'20', keep = b'0123456789')
print(trans(b'http://www.csdn.net/wirelessqa 520520'))
#输出:b'55'

 

五、unicode.translate()

功能:#待完善。。。

#去掉字符的重音符,重音符可以理解为中文的拼音的音标;

#将unicode的代码点(u751F),转换为汉字;

a = '\\u751F\\u5316\\u5371\\u673A'
#'utf-8':表示?
print (a.encode('utf-8').decode('unicode_escape'))
#输出:生化危机

 

posted @ 2018-04-11 10:29  何永灿  阅读(1387)  评论(0编辑  收藏  举报