python字符串操作大全
1、去空格 strip()
>>> s = 'a b c d ' >>> s.strip() 'a b c d'
2、lstrip() 方法用于截掉字符串左边的空格或指定字符
#!/usr/bin/python str = " this is string example!" print str.lstrip() str = "99999this is string example!888888" print str.lstrip('9')
以上实例输出结果如下:
$ python lstrip.py this is string example! this is string example!888888
3、Python rstrip() 删除 string 字符串末尾的指定字符(默认为空格).
#!/usr/bin/env python str = " this is string example!!! " print str.rstrip() str = "9999 this is string example!!!88888" #注意:要删除的字符一定要在末尾 print str.rstrip('8') ~
以上实例输出的结果如下:
$ python rstrip.py this is string example!!! 9999 this is string example!!!
4、字符串长度获取len(str)
>>> str='python string function' >>> print '%s length=%d' % (str,len(str)) python string function length=22
5、连接字符串
>>> str1='strcat' >>> str2='append' >>> str1 += str2 >>> print str1 strcatappend
6、查找字符str.index()
>>> str1='strchr' >>> str2='s' >>> num=str1.index(str2) >>> print num 0 >>> str1='strchr' >>> str2='t' >>> num=str1.index(str2) >>> print num 1
>>> str1='strchr' >>> str2='s' >>> num=str1.index(str2) >>> print num 0
7、字符串比较,cmp(x,y) 函数用于比较2个对象,如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1。
>>> str1='strchr' >>> str2='strch' >>> print cmp(str1,str2) 1
#!/usr/bin/env python print "cmp(80,100) :", cmp(80,100) print "cmp(180,100) :",cmp(180, 100) ~
以上实例的输出结果是:
$ python cmp.py cmp(80,100) : -1 cmp(180,100) : 1
8、截取字符串
特别注意:下标从0开始;str[0:3]不包含下标为3的字符。 str = ’0123456789′
>>>print str[0:3] #截取第一位到第三位的字符
012
>>>print str[:] #截取字符串的全部字符
0123456789
>>>print str[6:] #截取第七个字符到结尾
6789
>>>print str[:-3] #截取从头开始到倒数第三个字符之前
0123456
>>>print str[2] #截取第三个字符
2
>>>print str[-1] #截取倒数第一个字符
9
>>>print str[::-1] #创造一个与原字符串顺序相反的字符串
9876543210
>>>print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符
78
>>>print str[-3:] #截取倒数第三位到结尾
789
9、字符串中的搜索和替换:
S.find(substr, [start, [end]]) #返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1。start和end作用就相当于在S[start:end]中搜索 S.index(substr, [start, [end]]) #与find()相同,只是在S中没有substr时,会返回一个运行时错误 S.rfind(substr, [start, [end]]) #返回S中最后出现的substr的第一个字母的标号,如果S中没有substr则返回-1,也就是说从右边算起的第一次出现的substr的首字母标号 S.rindex(substr, [start, [end]]) S.count(substr, [start, [end]]) #计算substr在S中出现的次数 S.replace(oldstr, newstr, [count]) #把S中的oldstr替换为newstr,count为替换次数。这是替换的通用形式,还有一些函数进行特殊字符的替换 S.strip([chars]) #把S中前后chars中有的字符全部去掉,可以理解为把S前后chars替换为None S.lstrip([chars]) S.rstrip([chars]) S.expandtabs([tabsize]) #把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个
>>> S = 'testsubstrtest' >>> S.find('sub') 4 >>> >>> S.find('te') 0 >>> S.index('te') 0 >>> S.count('test') 2
10、字符串的分割和组合:
S.split([sep, [maxsplit]]) #以sep为分隔符,把S分成一个list。maxsplit表示分割的次数。默认的分割符为空白字符 S.rsplit([sep, [maxsplit]]) S.splitlines([keepends]) #把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。 S.join(seq) #把seq代表的序列──字符串序列,用S连接起来 字符串的mapping,这一功能包含两个函数: String.maketrans(from, to) #返回一个256个字符组成的翻译表,其中from中的字符被一一对应地转换成to,所以from和to必须是等长的。 S.translate(table[,deletechars]) # 使用上面的函数产后的翻译表,把S进行翻译
split()通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串
#!/usr/bin/python str = 'abc def ghi' print str.split() print str.split(' ',1 ) 以上实例的输出结果是: ['abc', 'def', 'ghi'] ['abc', 'def ghi']
join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
>>> str="." >>> seq=("a","b","c") >>> print str.join(seq) a.b.c
11、字符串中字符大小写的变换:
S.lower() #小写 S.upper() #大写 S.swapcase() #大小写互换 S.capitalize() #首字母大写 String.capwords(S) #这是模块中的方法。它把S用split()函数分开,然后用 capitalize()把首字母变成大写,最后用join()合并到一起 S.title() #只有首字母大写,其余为小写,模块中没有这个方法
12、字符串去空格及去指定字符
去两边空格:str.strip() 去左空格:str.lstrip() 去右空格:str.rstrip() 去两边字符串:str.strip('d'),相应的也有lstrip,rstrip str=' python String function ' print '%s strip=%s' % (str,str.strip()) str='python String function' print '%s strip=%s' % (str,str.strip('d')) 按指定字符分割字符串为数组:str.split(' ')
13、字符串编码和解码的函数:
S.encode([encoding,[errors]]) # 其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为strict,意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefre S.encode([encoding,[errors]]) # 其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。这一部分内容涉及codecs模块,不是特明白 S.decode([encoding,[errors]]) 字符串的测试函数,这一类函数在string模块中没有,这些函数返回的都是bool值: S.startwith(prefix[,start[,end]]) #是否以prefix开头 S.endwith(suffix[,start[,end]]) #以suffix结尾 S.isalnum() #是否全是字母和数字,并至少有一个字符 S.isalpha() #是否全是字母,并至少有一个字符 S.isdigit() #是否全是数字,并至少有一个字符 S.isspace() #是否全是空白字符,并至少有一个字符 S.islower() #S中的字母是否全是小写 S.isupper() #S中的字母是否便是大写 S.istitle() #S是否是首字母大写的
14、join()方法用于字符串的连接
>>> s = ['a','b','c','d'] >>> print ''.join(s) abcd
>>> s = ['a','b','c','d'] >>> print '*'.join(s) a*b*c*d
15、使用%连接多个变量
a = 'hello' b = 'python' c = 1 print '%s %s %s %s' % (a, b, c, s)
以上实例的输出结果为:
hello python 1 ['a', 'b', 'c', 'd']