python基础-字符串常用方法

1.字符串capitalize函数

  (capitalize vt. 资本化,用大写字母书写(或印刷); 把…首字母大写;)

  将字符串的首字母大写,其它字母小写;

  用法:newstr = string.capitalize() 修改后生成一个新字符串(因为字符串是不可更改数据类型);

  

  ''.capitalize() 返回为空,不会报错;

  ' '.capitalize()返回空格,不会报错;

  总结一下,无论字符串中包含什么字符,capitalize()只对字母有效,首位是字母就大写,非首位是字母就小写。

2.字符串内置函数lower()

  lower() 将所有字母变成小写字母,同capitalize() 方法只对字母有效;

  newstr = string.lower()同样生成新字符串(再次加深印象,字符串是不可修改数据类型);

  还有一个casefold()方法,也是将所有字母变成小写,用法和lower()一致;

  区别:casefold()可以将德语等小语种的特殊字母变成小写,lower()只对a-z字母有效,

     开发中不接触小语种的话,二者返回结果无差别。

  

3.字符串内置函数upper()

  将字符串中所有字母变成大写,同样只对字母有效;

  

4.字符串内置函数swapcase()

  swap 交换;

  swapcase() 将字符串中大写字母变小写、小写字母变大写,同样只对字母有效;

  

5.字符串内置函数zfill()

  为字符串指定宽度,不足的位置用0填充;(不常用)

  newstr = string.zfill(width) 参数width: 指定需要的宽度;

  

6.字符串内置函数count()

  返回要查找成员的个数,int = string.count(item) 参数item是待查找的成员;(常用于对一些结果log的解析)

  字符串中若没有要查找的成员,则返回0;

  

7.字符串内置函数startswith()和endswith()

  startswith()判断字符串开头是否是某成员;

  endswith()判断字符串结尾是否是某成员;

  string.startswith(item)参数是待查成员、string.endswith(item) 参数是待查成员,返回值均是布尔值;

  

8.字符串内置函数find和index

  查找字符串中成员的位置,(字符串中从左以0开始标注字符的位置,空格也算一个位置);

  string.find(item) 返回item的位置,成员不存在时返回-1;

  string.index(item)返回item的位置,成员不存在时程序会报错。

  

9.字符串内置函数strip()

  去除字符串左右两边的指定字符;

  string.strip(字符) 参数可不填,默认是空格;传入的参数如果并不在开头或结尾,则无效,但程序不会报错;

  'erererddtt'.strip('er') #ddtt 指定参数是‘er’,开头所有连续重复的er都会去掉;

  lstrip(字符) 去除开头的指定字符,rstrip(字符)去除结尾的指定字符;默认也是去除空格;

  

10.字符串内置函数replace()

  将字符串中的旧成员替换成新成员,可以指定替换的个数;

  string.replace(old, new, max)旧成员,新成员,替换个数(可以不指定,默认是全部替换);

  常用于一些敏感词汇的替换,如下:

  

11.字符串的一些判断类型的内置函数

  isspace() 判断字符串是否仅有空格组成,booltype = string.isspace(), (仅由空格组成的字符串,并不是空字符串);

  istitle() 判断字符串是否是标题类型,booltype = string.istitle()

                  (标题类型:英文字符串由不同单词组成,每个单词首字母要是大写,其余字母都是小写就是标题类型);

  isupper() 和 islower()  判断字符串中的字母是否都是大写或小写 ;

  以上方法只检测字符串中的字母,对其它字符不做判断

  

12.字符串的编码格式

  将世界各种语言翻译成计算机可读懂字符的过程,就是编码;

  计算机可识别字符和语言字符的对照表,就是一个个不同的编码格式;

  常见编码格式:gbk中文编码、ASCII英文;(在开发过程中,指定对应的编码格式,就可以输出对应语言的信息了,否则会输出乱码)

  

  日语、法语、中文等,都有自己独立的编码格式,若想在中文脚本中使用法语,就会比较麻烦,这就需要一个全部语言都通用的编码格式,

  所以就出现了我们常用的国际通用编码格式utf-8。 # coding:utf-8

13.字符串的格式化

  一个固定的字符串中,某些元素是根据变量的值而改变的字符串,这种书写方式,就是字符串的格式化;

  使用场景:统一发送邮件、短消息、app推送等内容时,信息内容模板相同、只有个人信息不同,为了方便就可以使用字符串的格式化;

  

  几种不同的格式化方法:

  用%格式化字符串

    'my name is %s, i love %s' % ('xiao lu', 'python')

    

    print('i am %s')  # i am %s 未指定%s对应的值打印时,不会报错,会带着%s直接打印出来;

    %s是通用的格式化字符,还有其它多种格式化符号;

    %d 格式化整型、%f 格式化浮点数、%u 格式化无符号整型(正整型)(官方描述)、%c 格式化成数字对应的字符;

    

    

  使用format函数

    'hello {},我的手机号是{}'.format('xiao lu', 1234567890)

    

  使用f''方法

    

14.字符串的转义字符

  python字符串中通过一些特殊字符来表示换行、回车、后退、tab键等功能,这些就是转义字符;

  \n 换行  \t 横向制表符(间隔符、tab)  \b 退格符(光标前移一个,会删除前一个) \r 回车  

  \a 响铃  \v纵向制表符(打印会出现一个男性符号)   \f 翻页 (打印会出现一个女性符号)

  \' 转义字符中的单引号  \''转义字符中的双引号 \\转义斜杠;

  

  比较常用的就是\n  \t  \\  \'  \''  , 其它不太常用,且不同编译环境,一些转义字符的效果不一定会显示出来,不用纠结。

 

总结

  

 

posted @ 2022-10-16 12:27  whiteList  阅读(459)  评论(0编辑  收藏  举报