【Python学习之四】集合类型
环境
虚拟机:VMware 10
Linux版本:CentOS-6.5-x86_64
客户端:Xshell4
FTP:Xftp4
python3.6
一、字符串:字符串实际上就是字符的数组
1、切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
(1)python中从左侧开始,下标 0 开始;从右侧,下标从-1开始;
(2)切片的语法:[起始:结束:步长],选取的区间属于左闭右开型,即从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身),步长:表示下标变化的规律。
示例:
a='abcdefg' print(a[0])#取字符串0位置字符:a print(a[-1])#从右侧取字符串-1位置字符:g print(a[2:10])#如果结束位置超过字符串总长度 不会报错 会一直取到字符串末尾:cdefg #print(a[10])#如果直接使用下标超过字符串长度的下标取值 会报错:IndexError: string index out of range print(a[:3])#取字符串0-2位置字符 起始位置0可以省略:abc print(a[3:])#取字符串3到末尾字符 结束位置为末尾 可以省略:defg print(a[0:3])#取字符串0-2位置字符:abc print(a[1:-1])#取 下标为1开始 到 最后第2个 之间的字符 print(a[0:4:3])#从0位置开始 每3个长度取一个字符串:ad print(a[::-1])#末尾到开始区间 按照从右向左取值 相当于反转字符串:gfedcba print(a[0:6:-2])#没有结果 从0开始向左没有值了 print(a[6:0:-2])#从下标6开始向左每隔2个位置取值 不包括0位置:gec
2、字符串常用API
<1>find == java Indexof方法
检测 str 是否包含在 mystr中,如果是返回开始的索引值,否则返回-1
mystr.find(str, start=0, end=len(mystr))
<2>index
跟find()方法一样,只不过如果str不在 mystr中会报一个异常.
mystr.index(str, start=0, end=len(mystr))
<3>count
返回 str在start和end之间 在 mystr里面出现的次数
mystr.count(str, start=0, end=len(mystr))
<4>replace
把 mystr 中的 str1 替换成 str2,如果 count 指定,则替换不超过 count 次.
mystr.replace(str1, str2, mystr.count(str1))
<5>split
以 str 为分隔符切片 mystr,如果 maxsplit有指定值,则仅分隔 maxsplit 个子字符串
mystr.split(str=" ", 2)
<6>capitalize
把字符串的第一个字符大写
mystr.capitalize()
<7>title
把字符串的每个单词首字母大写
<8>startswith
检查字符串是否是以 obj 开头, 是则返回 True,否则返回 False
mystr.startswith(obj)
<9>endswith
检查字符串是否以obj结束,如果是返回True,否则返回 False.
mystr.endswith(obj)
<10>lower
转换 mystr 中所有大写字符为小写
mystr.lower()
<11>upper
转换 mystr 中的小写字母为大写
mystr.upper()
<12>ljust
返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
mystr.ljust(width)
<13>rjust
返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
mystr.rjust(width)
<14>center
返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
mystr.center(width)
<15>lstrip
删除 mystr 左边的空白字符
mystr.lstrip()
<16>rstrip
删除 mystr 字符串末尾的空白字符
mystr.rstrip()
<17>strip ---java trim
删除mystr字符串两端的空白字符
<18>rfind
类似于 find()函数,不过是从右边开始查找.
mystr.rfind(str, start=0,end=len(mystr) )
<19>rindex
类似于 index(),不过是从右边开始.
mystr.rindex( str, start=0,end=len(mystr))
<20>partition
把mystr以str分割成三部分,str前,str和str后
mystr.partition(str)
<21>rpartition
类似于 partition()函数,不过是从右边开始.
mystr.rpartition(str)
<22>splitlines
按照换行符分隔,返回一个包含各行作为元素的列表
mystr.splitlines()
<23>isalpha
如果 mystr 所有字符都是字母 则返回 True,否则返回 False
mystr.isalpha()
<24>isdigit
如果 mystr 只包含数字则返回 True 否则返回 False.
mystr.isdigit()
<25>isalnum
如果 mystr 所有字符都是字母或数字则返回 True,否则返回 False
mystr.isalnum()
<26>isspace
如果 mystr 中只包含空格,则返回 True,否则返回 False.
mystr.isspace()
<27>join
将mystr 插入list的每个元素后面(list最后一个元素除外),构造出一个新的字符串
mystr.join(list)
示例:
b='ab cdefg' print(b.find('b'))#1 print(b.find('d',0))#4 #print(b.index('t'))#ValueError: substring not found print(b.count('d'))#1 print(b.replace('f', '123'))#ab cde123g print(b.split(sep=' ', maxsplit=1)) #['ab', 'cdefg'] print(b.capitalize())#Ab cdefg print(b.title())#Ab Cdefg print(b.startswith("ab"))#True print(b.endswith('cc'))#False print(b.lower())#ab cdefg print(b.upper())#AB CDEFG print(b.ljust(20))#ab cdefg print(b.rjust(20))# ab cdefg print('*'*50)#************************************************** print(b.center(50))# ab cdefg print('*'*50)#************************************************** print(b.strip()) print(b.partition(' '))#('ab', ' ', 'cdefg') c=['1','2','3'] print(b.join(c))#1ab cdefg2ab cdefg3
二、列表 list
Python内置的一种数据类型。list是一种有序、可重复、元素数据类型多样化的集合,可以随时添加和删除元素,使用中括号[]。
a=['a','b','c',10,12.5] b=['1','2'] print(len(a))#len()是内置函数 用来计算集合元素个数:5 print(a[2])#列表也是通过下标来获取元素:c #print(a[6])#超出长度取值报错:IndexError: list index out of range
1、列表增加元素
(1)append:在列表末尾追加新元素
a.append('d') print(a)#['a', 'b', 'c', 10, 12.5, 'd'] a.append(b) print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2']]
(2)extend:可以将另一个集合中的元素逐一添加到列表中
a.extend(b) print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']
(3)insert: 在指定位置index前插入元素object
a.insert(2, 500) print(a)#['a', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']
2、修改元素
修改元素的时候,要通过下标来确定要修改的是哪个元素,然后才能进行修改
a[0]='l' print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']
3、查找元素
in(存在),如果存在那么结果为true,否则为false
not in(不存在),如果不存在那么结果为true,否则false
print(10 in a)#True
index:返回某个元素下标,找不到报错ValueError: ' ' is not in list
count:返回某个元素的个数,找不到报错ValueError: ' ' is not in list
print(a.index('a', ))#找不到报错ValueError: 'a' is not in list print(a.count('a'))#找不到报错ValueError: 'a' is not in list
4、删除元素
pop:默认删除最后一个元素
a.pop() print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']
remove:根据元素的值进行删除第一个
a.remove('b') print(a)#['l', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']
del:根据下标进行删除,其实可以删除所有变量
del(a[0]) print(a)#[500, 'c', 10, 12.5, 'd', ['1', '2'], '1'] del(a) print(a)#NameError: name 'a' is not defined
5、排序
sort方法是将list按特定顺序重新排列,默认为由小到大,参数reverse=True可改为倒序,由大到小。
reverse方法是将list逆置。
c = [1, 4, 2, 3] c.sort() print(c)#[1, 2, 3, 4] c.reverse() print(c)#[4, 3, 2, 1]
6、遍历
(1)枚举
打印下标和元素
chars = ['a', 'b', 'c', 'd'] for i,chr in enumerate(chars): print(i,chr) # 0 a # 1 b # 2 c # 3 d
(2)通用方式
chars = ['a', 'b', 'c', 'd'] for chr in chars: print(chr) # a # b # c # d
(3)按照序号 类似枚举
for i in range(len(chars)): print(i, chars[i]) # 0 a # 1 b # 2 c # 3 d
(4)python2中的xrange
for i in xrange(len(chars)): print(i, chars[i]) # 0 a # 1 b # 2 c # 3 d
xrange 和range的区别:
range会直接将所有结果生成一个list对象;
xrange则不会直接生成一个list,而是一个生成器,会每次调用返回其中的一个值 ;
因此,xrange的循环性能比range好,尤其是当列表返回很大的情况。但是当你需要返回是一个列表的话,可以使用range
7、列表推导式
就是指的轻量级循环创建列表
示例:
a=[i for i in range(1,10)] print(a)#[1, 2, 3, 4, 5, 6, 7, 8, 9]
(1)在循环的过程中使用if 来确定 列表中元素的条件
a=[i for i in range(1,10) if i%2==0] print(a)#[2, 4, 6, 8]
(2)2个for循环
a=[(i,j) for i in range(1,5) for j in range(6,10)] print(a)#[(1, 6), (1, 7), (1, 8), (1, 9), (2, 6), (2, 7), (2, 8), (2, 9), (3, 6), (3, 7), (3, 8), (3, 9), (4, 6), (4, 7), (4, 8), (4, 9)]
(3)3个for循环
a=[(x,y,z) for x in range(2) for y in range(2) for z in range(2)] print(a)#[(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)]
三、元组
Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号(),列表使用方括号[]
元祖也可以使用下标获取元素:
t=('a','b','c',10,12.5,['A','B']) print(t)#('a', 'b', 'c', 10, 12.5, ['A', 'B']) print(t[2])#c tt=(1,)#只有1个元素的tuple定义时必须加一个逗号,,来消除歧义 print(tt)#(1,) ttt=(1) print(ttt)#1
元组用的不多,主要注意是元素不可改变,如果元素是引用类型,则引用类型元素中元素是可以改变的
t[5][0]='X' t[5][1]='Y' print(t)#('a', 'b', 'c', 10, 12.5, ['X', 'Y']) t[5]=['X','Y']#报错TypeError: 'tuple' object does not support item assignment
元组遍历:
tuple=(1,2,3,'a','b') for t in tuple: print(t) # 1 # 2 # 3 # a # b
四、字典dict(java中叫map)
键-值(key-value)存储,字典的每个元素由2部分组成,键:值,使用大括号{}表示,dict的key必须是不可变对象,比如字符串,整数等,不能使用list。
示例:
info = {'name':'班长', 'id':100, 'sex':'f', 'address':'地球亚洲中国北京'}
说明:
字典和列表
(1)字典和列表一样,也能够存储多个数据;
(2)dict内部存放的顺序和key放入的顺序是没有关系的
(3)字典中找某个元素时,是根据'名字'(就是冒号:前面的那个值,例如上面代码中的'name'、'id'、'sex');列表中找某个元素时,是根据下标进行的;
(4)字典查找和插入的速度极快,不会随着key的增加而变慢;列表查找和插入的时间随着元素的增加而增加;
(5)字典具有极快的查找速度,需要占用大量的内存,内存浪费多;列表占用空间小,浪费内存很少。
1、取值
在不确定字典中是否存在某个键而又想获取其值时,可以使用get方法,还可以设置默认值;
print(info['name'])#取值:班长 #print(info['age'])#报错:KeyError: 'age' print(info.get('name')) age=info.get('age') print(type(age))#age为None:<class 'NoneType'> age1=info.get('age',18)#若info中不存在'age'这个键,就返回默认值18 print(age1)#18
2、修改
info['id']=200 print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}
3、添加
如果在使用 变量名['键'] = 数据 时,这个“键”在字典中,不存在,那么就会新增这个元素
info['age']=18 print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18}
4、删除
del删除指定的元素
print('删除前:%s'%info)#删除前:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18} del info['age'] print('删除后:%s'%info)#删除后:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}
del删除整个字典
print('删除前:%s'%info)#删除前:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'} del info #print('删除后:%s'%info)#报错:NameError: name 'info' is not defined
清空整个字典
info = {'name':'monitor', 'sex':'f', 'address':'China'} print('清空前,%s'%info)#清空前,{'name': 'monitor', 'sex': 'f', 'address': 'China'} info.clear() print('清空后,%s'%info)#清空后,{}
5、len()测量字典中,键值对的个数
info = {'name':'monitor', 'sex':'f', 'address':'China'} print(len(info))#3
6、has_key (python2.7版本) == in 条件表达式
dict.has_key(key)如果key在字典中,返回True,否则返回False >>>info={'name':'monitor', 'sex':'f', 'address':'China'} >>>info.has_key('id') >>>False
7、字典四种遍历方式
(1)遍历字典的key(键)
dict={'name':'张三','age':20} for key in dict.keys(): print('key:%s,value:%s'%(key,dict[key])) #key:name,value:张三 #key:age,value:20
(2)遍历字典的value(值)
for value in dict.values(): print('value:%s'%value) # value:张三 # value:20
(3)遍历字典的项(元素)
#item是一个元组 for item in dict.items(): print(item) #('name', '张三') #('age', 20)
(4)遍历字典的key-value(键值对)
#注意区别 item()和items()
for key,value in dict.items(): print('key=%s,value=%s'%(key,value)) # key=name,value=张三 # key=age,value=20
小结:可变类型与不可变类型
1、可变类型,值可以改变:
列表 list
字典 dict
set (没有value的字典)
2、不可变类型,值不可以改变:
数值类型 int, long, bool, float
字符串 str
元组 tuple
3、集合类型
列表(list) |
a=[] |
先后顺序,有下标位[index],可以重复,可变类型 |
元组(tuple) |
a=() |
有先后顺序,有下标位,元素可以重复,不可变(只能查) |
字典(dict) |
a={key:value} |
没有先后顺序,没有下标,key不可重复,value可以,可变类型 |
集合(set) |
a=set() |
没有先后顺序,没有下标,不可重复,可变类型 |
参考: