第14讲:字符串--各种奇葩内置方法
一 字符串
1 定义:由数字、下划线、字母组成的一段字符
2 创建:我们用双引号或者单引号创建一个字符串,例如:s = "I love you!"
3 切片/截取:使用方括号和冒号截取字符串,具体语法为:[头下标:尾下标:步长]
- 获取的子字符串包含头下标的字符,但不包含尾下标的字符。
- 下标为空:表示从头取到尾
- 下标为正:使用正索引从字符串开头开始切片/截取
- 下标为负:使用负索引从字符串末尾开始切片/截取
- [头下标:尾下标:步长] :Python 列表截取可以接收第三个参数,参数作用是截取的步长
4 更新:使用切片的方法重新构建一个字符串,原来的字符串还在,不用的话会被垃圾回收机制回收
二 字符串方法
- capitalize():把字符串第一个字符改为大写
- casefold():将字符串的所有字符转为小写
- center(width) 将字符串居中,并使用空格填充长度为width的字符串
- count(sub[start[,end]]) 返回某个子字符串在整个字符串里面出现的次数
- encode(encoding = 'utf-8',errors='strict') 以enconding指定编码格式对字符串进行编码
- endswith(sub[start[,end]]) 检查字符串是否以sub字符串结束,如果是返回True,否则返回False
- startswith(sub[start[,end]]) 检查字符串是否以sub字符串开始,如果是返回True,否则返回False
- expandtabs([tabsize=8]) 把字符串中的tab符号"\t"转化为空格,如果不指定参数,默认tabsize=8
- find(sub[start[,end]]) 检测sub是否包含在字符串中,如果有则返回索引值,否则返回-1,start和end表示参数范围,可选
- rfind(sub[start[,end]]) 和find()方法类似,不过是从字符串右边开始查找
- index(sub[start[,end]]) 和find一样,不过如果sub不在字符串中会返回一个异常
- rindex(sub[start[,end]]) 类似于index方法,不过是从右边开始找
- isalnum() 所有字符都是数字或者字母,为真返回 True,否则返回 False。
- isalpha() 所有字符都是字母,为真返回 True,否则返回 False。
- isdigit() 所有字符都是数字,为真返回 True,否则返回 False。
- islower() 所有字符都是小写,为真返回 True,否则返回 False。
- isupper() 所有字符都是大写,为真返回 True,否则返回 False。
- istitle() 所有单词都是首字母大写,为真返回 True,否则返回 False。
- isspace() 所有字符都是空白字符,为真返回 True,否则返回 False。
- isdecimal() 如果字符串只包含十进制数则返回true,否则返回false。
- isnumeric() 如果字符串中只包含数字,则返回true,否则返回false
- join(sub) 以字符串作为分隔符,插入到字符串中的所有sub字符之间
- isjust(width) 返回一个左对齐的字符串,并使用空格填充至长度为width的新字符串
- rsjust(width) 返回一个右对齐的字符串,并使用空格填充至长度为width的新字符串
- istrip() 去掉字符串左边的所有空格
- strip() 删除字符串前边和后面的所有空格,中间的空格不删
- rstrip() 去掉字符串末尾的所有空格
- partition(sub) 找到字符串sub,把字符串分成一个三元组(pre_sub,sub,fol_sub),如果字符串不包含sub则返回('原字符串',' ',' ')
- rpartition(sub) 类似于partition方法,不过是从右边开始查找
- replace(old,new[,count]) 把字符串中的old字符串替换成新的字符串new,如果count指定,则替换不超过count次
- split(sep=None,maxsplit=-1) 不带参数默认是以空格为分隔符切片字符串,如果maxsplit参数有设置,则仅分隔maxsplit个字符串,返回切片后的字符串拼接的列表
- splitlines([keepends]) 按照'\n'分隔,返回一个包含各行作为元素的列表,如果keepends参数指定,则返回前keepends行
- swapcase() 翻转字符串中的大小写
- title() 返回标题化(所有单词都是首字母大些,其余字母小写)的字符串
- translate(table) 根据table规则(可以由str.maketrans('a','b')定制)转换字符串中的字符
- lower() 字符串中所有大写字母转换为小写
- upper() 字符串中所有小写字母转换为大写
- zfill(width) 返回字符串长度为width的字符串,原字符串右对齐,前面用0填充
translate(table) :举例
>>> str7 = 'aaaaassssssaaaaa' >>> str7.translate(str7.maketrans('s','b')) 'aaaaabbbbbbaaaaa' >>> str7.maketrans('s','b') {115: 98} >>>
三 课后练习
0. 还记得如何定义一个跨越多行的字符串吗(请至少写出两种实现的方法)?
方法一:
>>> str1 = '''待我长发及腰,将军归来可好?
此身君子意逍遥,怎料山河萧萧。
天光乍破遇,暮雪白头老。
寒剑默听奔雷,长枪独守空壕。
醉卧沙场君莫笑,一夜吹彻画角。
江南晚来客,红绳结发梢。'''
方法二:
>>> str2 = '待卿长发及腰,我必凯旋回朝。\
昔日纵马任逍遥,俱是少年英豪。\
东都霞色好,西湖烟波渺。\
执枪血战八方,誓守山河多娇。\
应有得胜归来日,与卿共度良宵。\
盼携手终老,愿与子同袍。'
方法三:
>>> str3 = ('待卿长发及腰,我必凯旋回朝。'
'昔日纵马任逍遥,俱是少年英豪。'
'东都霞色好,西湖烟波渺。'
'执枪血战八方,誓守山河多娇。'
'应有得胜归来日,与卿共度良宵。'
'盼携手终老,愿与子同袍。')
1. 三引号字符串通常我们用于做什么使用?
三引号字符串不赋值的情况下,通常当作跨行注释使用,例如:
'''这是一个三引号字符串用于注释的例子, 例子虽然只是简简单单的一句话, 却毫无遮掩地体现了作者用情至深, 所谓爱至深处情至简!''' print("I love FishC.com!")
2. file1 = open('C:\windows\temp\readme.txt', 'r') 表示以只读方式打开“C:\windows\temp\readme.txt”这个文本文件,但事实上这个语句会报错,知道为什么吗?你会如何修改?
会报错是因为在字符串中,我们约定“\t”和“\r”分别表示“横向制表符(TAB)”和“回车符”(详见:http://bbs.fishc.com/thread-92997-1-1.html),因此并不会按照我们计划的路径去打开文件。
Python 为我们铺好了解决的道路,只需要使用原始字符串操作符(R或r)即可:
>>> file1 = open(r'C:\windows\temp\readme.txt', 'r')
3. 有字符串:str1 = '<a href="http://www.fishc.com/dvd" target="_blank">鱼C资源打包</a>',请问如何提取出子字符串:'www.fishc.com'
方法一:切片
>>> str1[16:29]
方法二:使用partition函数
>>> str1 = '<a href="http://www.fishc.com/dvd" target="_blank">鱼C资源打包</a>' >>> str2 = str1.partition('www.fishc.com') >>> str3 = str2[1] >>> str3 'www.fishc.com' >>>
4. 如果使用负数作为索引值进行分片操作,按照第三题的要求你能够正确目测出结果吗?
>>> str1[-45:-32]
5. 还是第三题那个字符串,请问下边语句会显示什么内容?
>>> str1[20:-36]
'fishc',加入了负数索引,问题变得有些复杂,不过自己多尝试几次就可以熟练掌握了。
6. 据说只有智商高于150的鱼油才能解开这个字符串(还原为有意义的字符串):str1 = 'i2sl54ovvvb4e3bferi32s56h;$c43.sfc67o0cm99'
>>> str1 = 'i2sl54ovvvb4e3bferi32s56h;$c43.sfc67o0cm99' >>> str1[::3] 'ilovefishc.com'
7 动手练习:请写一个密码安全性检查的代码代码:ex14_check.py
# 密码安全性检查代码 # # 低级密码要求: # 1. 密码由单纯的数字或字母组成 # 2. 密码长度小于等于8位 # # 中级密码要求: # 1. 密码必须由数字、字母或特殊字符(仅限:~!@#$%^&*()_=-/,.?<>;:[]{}|\)任意两种组合 # 2. 密码长度不能低于8位 # # 高级密码要求: # 1. 密码必须由数字、字母及特殊字符(仅限:~!@#$%^&*()_=-/,.?<>;:[]{}|\)三种组合 # 2. 密码只能由字母开头 # 3. 密码长度不能低于16位 symbols = r'''~!@#$%^&*(){}[]\|'";:/?,.<>''' chars = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ' nums = '0123456789' password = input('请输入需要检查的密码组合:') # 判断长度 length = len(password) while (password.isspace() or length == 0): password = input("您输入的密码为空(或空格),请重新输入:") length = len(password) if length <= 8: flag_len = 1 elif 8 < length <= 16 : flag_len = 2 else: flag_len = 3 flag_con = 0 # 判断是否包含特殊字符 for each in password: if each in symbols: flag_con += 1 break # 判断是否包含字母 for each in password: if each in chars: flag_con += 1 break # 判断是否包含数字 for each in password: if each in nums: flag_con += 1 break # 打印结果 while 1: print("您的密码安全级别被评定为:",end = '') if flag_len == 1 or flag_con == 1: print("低") elif flag_len == 3 and flag_con == 3 and (password[0] in chars): print("高") print("请继续保持") break else: print("中") print("请按以下方式提升您的密码安全级别:\n\ \t1.密码必须由数字、字母及特殊字符三种组合\n\ \t2.密码只能由字母开头\n\ \t3.密码长度不能低于16位") break
代码讲解:
整个代码的主要结构分为三部分:
1 密码长度判断:flag_len
- flag_len =1 密码长度小于8
- flag_len =2 密码长度大于8,小于等于16
- flag_len =3 密码长度大于16
2 密码内容判断:flag_con
- flag_con =0 密码不包含要检测的内容:特殊字符、字母、数字
- flag_con =1 密码只包含字母、密码只包含特殊字符、密码只包含数字
- flag_con =2 密码包含字母、数字、特殊字符中的任意两种
- flag_con =3 密码包含特殊字符、字母、数字三种
3 密码级别判断并打印
- 密码非空
- flag_len =3 and flag_con =3 级别:高
- flag_len =1 and flag_con =1 级别:低 (是不是忘记考虑了只有特殊字符的情况?改正方法:在条件判断后面加如下语句and (each not in symbols)即可)
- 其它 级别:中
我的思维盲区:
我在看到题目的时候想用字符串相关的方法去对相应的条件进行判断,结果是方法根本不够用。看了答案之后,学到了成员运算符in的用法,并且该程序关键在于把三个判断部分分开来实现,即把一个大问题简化成各种小问题,然后再通过把小问题的判断结果组合从而得到我们想要的结果,即模块化思维,这种在思维在编写代码方面非常重要。