python基础-字符串常用方法
1.字符串capitalize函数
(capitalize vt. 资本化,用大写字母书写(或印刷); 把…首字母大写;)
将字符串的首字母大写,其它字母小写;
用法:newstr = string.capitalize()
修改后生成一个新字符串(因为字符串是不可更改数据类型);
''.capitalize()
返回为空,不会报错;
' '.capitalize()
返回空格,不会报错;
总结一下,无论字符串中包含什么字符,capitalize()只对字母有效,首位是字母就大写,非首位是字母就小写。
2.字符串内置函数lower()
lower() 将所有字母变成小写字母,同capitalize() 方法只对字母有效;
newstr = string.lower()
同样生成新字符串(再次加深印象,字符串是不可修改数据类型);
还有一个casefold()方法,也是将所有字母变成小写,用法和lower()一致;
区别:casefold()可以将德语等小语种的特殊字母变成小写,lower()只对a-z字母有效,
开发中不接触小语种的话,二者返回结果无差别。
3.字符串内置函数upper()
将字符串中所有字母变成大写,同样只对字母有效;
4.字符串内置函数swapcase()
swap 交换;
swapcase() 将字符串中大写字母变小写、小写字母变大写,同样只对字母有效;
5.字符串内置函数zfill()
为字符串指定宽度,不足的位置用0填充;(不常用)
newstr = string.zfill(width)
参数width: 指定需要的宽度;
6.字符串内置函数count()
返回要查找成员的个数,int = string.count(item)
参数item是待查找的成员;(常用于对一些结果log的解析)
字符串中若没有要查找的成员,则返回0;
7.字符串内置函数startswith()和endswith()
startswith()判断字符串开头是否是某成员;
endswith()判断字符串结尾是否是某成员;
string.startswith(item)
参数是待查成员、string.endswith(item)
参数是待查成员,返回值均是布尔值;
8.字符串内置函数find和index
查找字符串中成员的位置,(字符串中从左以0开始标注字符的位置,空格也算一个位置);
string.find(item)
返回item的位置,成员不存在时返回-1;
string.index(item)
返回item的位置,成员不存在时程序会报错。
9.字符串内置函数strip()
去除字符串左右两边的指定字符;
string.strip(字符)
参数可不填,默认是空格;传入的参数如果并不在开头或结尾,则无效,但程序不会报错;
'erererddtt'.strip('er') #ddtt
指定参数是‘er’,开头所有连续重复的er都会去掉;
lstrip(字符) 去除开头的指定字符,rstrip(字符)去除结尾的指定字符;默认也是去除空格;
10.字符串内置函数replace()
将字符串中的旧成员替换成新成员,可以指定替换的个数;
string.replace(old, new, max)
旧成员,新成员,替换个数(可以不指定,默认是全部替换);
常用于一些敏感词汇的替换,如下:
11.字符串的一些判断类型的内置函数
isspace() 判断字符串是否仅有空格组成,booltype = string.isspace()
, (仅由空格组成的字符串,并不是空字符串);
istitle() 判断字符串是否是标题类型,booltype = string.istitle()
(标题类型:英文字符串由不同单词组成,每个单词首字母要是大写,其余字母都是小写就是标题类型);
isupper() 和 islower() 判断字符串中的字母是否都是大写或小写 ;
以上方法只检测字符串中的字母,对其它字符不做判断;
12.字符串的编码格式
将世界各种语言翻译成计算机可读懂字符的过程,就是编码;
计算机可识别字符和语言字符的对照表,就是一个个不同的编码格式;
常见编码格式:gbk中文编码、ASCII英文;(在开发过程中,指定对应的编码格式,就可以输出对应语言的信息了,否则会输出乱码)
日语、法语、中文等,都有自己独立的编码格式,若想在中文脚本中使用法语,就会比较麻烦,这就需要一个全部语言都通用的编码格式,
所以就出现了我们常用的国际通用编码格式utf-8。 # coding:utf-8
13.字符串的格式化
一个固定的字符串中,某些元素是根据变量的值而改变的字符串,这种书写方式,就是字符串的格式化;
使用场景:统一发送邮件、短消息、app推送等内容时,信息内容模板相同、只有个人信息不同,为了方便就可以使用字符串的格式化;
几种不同的格式化方法:
用%格式化字符串
'my name is %s, i love %s' % ('xiao lu', 'python')
print('i am %s') # i am %s
未指定%s对应的值打印时,不会报错,会带着%s直接打印出来;
%s是通用的格式化字符,还有其它多种格式化符号;
%d 格式化整型、%f 格式化浮点数、%u 格式化无符号整型(正整型)(官方描述)、%c 格式化成数字对应的字符;
使用format函数
'hello {},我的手机号是{}'.format('xiao lu', 1234567890)
使用f''方法
14.字符串的转义字符
python字符串中通过一些特殊字符来表示换行、回车、后退、tab键等功能,这些就是转义字符;
\n 换行 \t 横向制表符(间隔符、tab) \b 退格符(光标前移一个,会删除前一个) \r 回车
\a 响铃 \v纵向制表符(打印会出现一个男性符号) \f 翻页 (打印会出现一个女性符号)
\' 转义字符中的单引号 \''转义字符中的双引号 \\转义斜杠;
比较常用的就是\n \t \\ \' \'' , 其它不太常用,且不同编译环境,一些转义字符的效果不一定会显示出来,不用纠结。
总结