【Python学习之四】集合类型

环境
  虚拟机:VMware 10
  Linux版本:CentOS-6.5-x86_64
  客户端:Xshell4
  FTP:Xftp4
  python3.6

一、字符串:字符串实际上就是字符的数组
1、切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
(1)python中从左侧开始,下标 0 开始;从右侧,下标从-1开始;
(2)切片的语法:[起始:结束:步长],选取的区间属于左闭右开型,即从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身),步长:表示下标变化的规律。

示例:

a='abcdefg'
print(a[0])#取字符串0位置字符:a
print(a[-1])#从右侧取字符串-1位置字符:g

print(a[2:10])#如果结束位置超过字符串总长度 不会报错  会一直取到字符串末尾:cdefg
#print(a[10])#如果直接使用下标超过字符串长度的下标取值 会报错:IndexError: string index out of range

print(a[:3])#取字符串0-2位置字符 起始位置0可以省略:abc
print(a[3:])#取字符串3到末尾字符 结束位置为末尾 可以省略:defg

print(a[0:3])#取字符串0-2位置字符:abc
print(a[1:-1])#取 下标为1开始 到 最后第2个  之间的字符
print(a[0:4:3])#从0位置开始 每3个长度取一个字符串:ad
print(a[::-1])#末尾到开始区间 按照从右向左取值 相当于反转字符串:gfedcba
print(a[0:6:-2])#没有结果 从0开始向左没有值了
print(a[6:0:-2])#从下标6开始向左每隔2个位置取值 不包括0位置:gec

 

2、字符串常用API
<1>find == java Indexof方法
检测 str 是否包含在 mystr中,如果是返回开始的索引值,否则返回-1
mystr.find(str, start=0, end=len(mystr))
<2>index
跟find()方法一样,只不过如果str不在 mystr中会报一个异常.
mystr.index(str, start=0, end=len(mystr))
<3>count
返回 str在start和end之间 在 mystr里面出现的次数
mystr.count(str, start=0, end=len(mystr))
<4>replace
把 mystr 中的 str1 替换成 str2,如果 count 指定,则替换不超过 count 次.
mystr.replace(str1, str2, mystr.count(str1))
<5>split
以 str 为分隔符切片 mystr,如果 maxsplit有指定值,则仅分隔 maxsplit 个子字符串
mystr.split(str=" ", 2)
<6>capitalize
把字符串的第一个字符大写
mystr.capitalize()
<7>title
把字符串的每个单词首字母大写
<8>startswith
检查字符串是否是以 obj 开头, 是则返回 True,否则返回 False
mystr.startswith(obj)
<9>endswith
检查字符串是否以obj结束,如果是返回True,否则返回 False.
mystr.endswith(obj)
<10>lower
转换 mystr 中所有大写字符为小写
mystr.lower()
<11>upper
转换 mystr 中的小写字母为大写
mystr.upper()
<12>ljust
返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
mystr.ljust(width)
<13>rjust
返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
mystr.rjust(width)
<14>center
返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
mystr.center(width)
<15>lstrip
删除 mystr 左边的空白字符
mystr.lstrip()
<16>rstrip
删除 mystr 字符串末尾的空白字符
mystr.rstrip()
<17>strip ---java trim
删除mystr字符串两端的空白字符
<18>rfind
类似于 find()函数,不过是从右边开始查找.
mystr.rfind(str, start=0,end=len(mystr) )
<19>rindex
类似于 index(),不过是从右边开始.
mystr.rindex( str, start=0,end=len(mystr))
<20>partition
把mystr以str分割成三部分,str前,str和str后
mystr.partition(str)
<21>rpartition
类似于 partition()函数,不过是从右边开始.
mystr.rpartition(str)
<22>splitlines
按照换行符分隔,返回一个包含各行作为元素的列表
mystr.splitlines()
<23>isalpha
如果 mystr 所有字符都是字母 则返回 True,否则返回 False
mystr.isalpha()
<24>isdigit
如果 mystr 只包含数字则返回 True 否则返回 False.
mystr.isdigit()
<25>isalnum
如果 mystr 所有字符都是字母或数字则返回 True,否则返回 False
mystr.isalnum()
<26>isspace
如果 mystr 中只包含空格,则返回 True,否则返回 False.
mystr.isspace()
<27>join

将mystr 插入list的每个元素后面(list最后一个元素除外),构造出一个新的字符串

mystr.join(list)

示例:

b='ab cdefg'
print(b.find('b'))#1  
print(b.find('d',0))#4

#print(b.index('t'))#ValueError: substring not found

print(b.count('d'))#1
print(b.replace('f', '123'))#ab cde123g

print(b.split(sep=' ', maxsplit=1)) #['ab', 'cdefg']
print(b.capitalize())#Ab cdefg
print(b.title())#Ab Cdefg
print(b.startswith("ab"))#True
print(b.endswith('cc'))#False
print(b.lower())#ab cdefg
print(b.upper())#AB CDEFG
print(b.ljust(20))#ab cdefg            
print(b.rjust(20))#            ab cdefg
print('*'*50)#**************************************************
print(b.center(50))#                     ab cdefg                     
print('*'*50)#**************************************************
print(b.strip())
print(b.partition(' '))#('ab', ' ', 'cdefg')
c=['1','2','3']
print(b.join(c))#1ab cdefg2ab cdefg3

 

 二、列表 list

Python内置的一种数据类型。list是一种有序、可重复、元素数据类型多样化的集合,可以随时添加和删除元素,使用中括号[]。

a=['a','b','c',10,12.5]
b=['1','2']
print(len(a))#len()是内置函数 用来计算集合元素个数:5
print(a[2])#列表也是通过下标来获取元素:c
#print(a[6])#超出长度取值报错:IndexError: list index out of range

 

1、列表增加元素
(1)append:在列表末尾追加新元素

a.append('d')
print(a)#['a', 'b', 'c', 10, 12.5, 'd']
a.append(b)
print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2']]

 

(2)extend:可以将另一个集合中的元素逐一添加到列表中

a.extend(b)
print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

 

(3)insert: 在指定位置index前插入元素object

a.insert(2, 500)
print(a)#['a', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

 

2、修改元素
修改元素的时候,要通过下标来确定要修改的是哪个元素,然后才能进行修改

a[0]='l'
print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

 

3、查找元素
in(存在),如果存在那么结果为true,否则为false
not in(不存在),如果不存在那么结果为true,否则false

print(10 in a)#True

 

index:返回某个元素下标,找不到报错ValueError: ' ' is not in list
count:返回某个元素的个数,找不到报错ValueError: ' ' is not in list

print(a.index('a', ))#找不到报错ValueError: 'a' is not in list
print(a.count('a'))#找不到报错ValueError: 'a' is not in list

 

4、删除元素
pop:默认删除最后一个元素

a.pop()
print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']

remove:根据元素的值进行删除第一个

a.remove('b')
print(a)#['l', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']

 

del:根据下标进行删除,其实可以删除所有变量

del(a[0])
print(a)#[500, 'c', 10, 12.5, 'd', ['1', '2'], '1']
del(a)
print(a)#NameError: name 'a' is not defined

 

5、排序

sort方法是将list按特定顺序重新排列,默认为由小到大,参数reverse=True可改为倒序,由大到小。
reverse方法是将list逆置。

c = [1, 4, 2, 3]
c.sort()
print(c)#[1, 2, 3, 4]
c.reverse()
print(c)#[4, 3, 2, 1]

 

6、遍历

(1)枚举

打印下标和元素

chars = ['a', 'b', 'c', 'd']
for i,chr in enumerate(chars):
    print(i,chr)
# 0 a
# 1 b
# 2 c
# 3 d

(2)通用方式

chars = ['a', 'b', 'c', 'd']
for chr in chars:
    print(chr)
# a
# b
# c
# d

(3)按照序号 类似枚举

for i in range(len(chars)):
    print(i, chars[i])
# 0 a
# 1 b
# 2 c
# 3 d 

(4)python2中的xrange

for i in xrange(len(chars)):
    print(i, chars[i])
# 0 a
# 1 b
# 2 c
# 3 d

xrange 和range的区别:

  range会直接将所有结果生成一个list对象;
  xrange则不会直接生成一个list,而是一个生成器,会每次调用返回其中的一个值 ;
  因此,xrange的循环性能比range好,尤其是当列表返回很大的情况。但是当你需要返回是一个列表的话,可以使用range

7、列表推导式
就是指的轻量级循环创建列表
示例:

a=[i for i in range(1,10)]
print(a)#[1, 2, 3, 4, 5, 6, 7, 8, 9]

(1)在循环的过程中使用if 来确定 列表中元素的条件

a=[i for i in range(1,10) if i%2==0]
print(a)#[2, 4, 6, 8]

(2)2个for循环

a=[(i,j) for i in range(1,5) for j in range(6,10)]
print(a)#[(1, 6), (1, 7), (1, 8), (1, 9), (2, 6), (2, 7), (2, 8), (2, 9), (3, 6), (3, 7), (3, 8), (3, 9), (4, 6), (4, 7), (4, 8), (4, 9)]

(3)3个for循环

a=[(x,y,z) for x in range(2) for y in range(2) for z in range(2)]
print(a)#[(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)]

 

三、元组
Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号(),列表使用方括号[]

元祖也可以使用下标获取元素:

t=('a','b','c',10,12.5,['A','B'])
print(t)#('a', 'b', 'c', 10, 12.5, ['A', 'B'])
print(t[2])#c

tt=(1,)#只有1个元素的tuple定义时必须加一个逗号,,来消除歧义
print(tt)#(1,)
ttt=(1)
print(ttt)#1

 

元组用的不多,主要注意是元素不可改变,如果元素是引用类型,则引用类型元素中元素是可以改变的

t[5][0]='X'
t[5][1]='Y'
print(t)#('a', 'b', 'c', 10, 12.5, ['X', 'Y'])

t[5]=['X','Y']#报错TypeError: 'tuple' object does not support item assignment

 元组遍历:

tuple=(1,2,3,'a','b')
for t in tuple:
    print(t)
# 1
# 2
# 3
# a
# b

 

四、字典dict(java中叫map)
键-值(key-value)存储,字典的每个元素由2部分组成,键:值,使用大括号{}表示,dict的key必须是不可变对象,比如字符串,整数等,不能使用list。

示例:
info = {'name':'班长', 'id':100, 'sex':'f', 'address':'地球亚洲中国北京'}
说明:
字典和列表
(1)字典和列表一样,也能够存储多个数据;
(2)dict内部存放的顺序和key放入的顺序是没有关系的
(3)字典中找某个元素时,是根据'名字'(就是冒号:前面的那个值,例如上面代码中的'name'、'id'、'sex');列表中找某个元素时,是根据下标进行的;
(4)字典查找和插入的速度极快,不会随着key的增加而变慢;列表查找和插入的时间随着元素的增加而增加;
(5)字典具有极快的查找速度,需要占用大量的内存,内存浪费多;列表占用空间小,浪费内存很少。

1、取值
在不确定字典中是否存在某个键而又想获取其值时,可以使用get方法,还可以设置默认值;

print(info['name'])#取值:班长
#print(info['age'])#报错:KeyError: 'age'

print(info.get('name'))
age=info.get('age')
print(type(age))#age为None:<class 'NoneType'>
age1=info.get('age',18)#若info中不存在'age'这个键,就返回默认值18
print(age1)#18

 

2、修改

info['id']=200
print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}

 

3、添加
如果在使用 变量名['键'] = 数据 时,这个“键”在字典中,不存在,那么就会新增这个元素

info['age']=18
print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18}

 

4、删除
del删除指定的元素

print('删除前:%s'%info)#删除前:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18}
del info['age']
print('删除后:%s'%info)#删除后:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}

 

del删除整个字典

print('删除前:%s'%info)#删除前:{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}
del info
#print('删除后:%s'%info)#报错:NameError: name 'info' is not defined

清空整个字典

info = {'name':'monitor', 'sex':'f', 'address':'China'}
print('清空前,%s'%info)#清空前,{'name': 'monitor', 'sex': 'f', 'address': 'China'}
info.clear()
print('清空后,%s'%info)#清空后,{}

 

5、len()测量字典中,键值对的个数

info = {'name':'monitor', 'sex':'f', 'address':'China'}
print(len(info))#3

 

6、has_key (python2.7版本) == in 条件表达式

dict.has_key(key)如果key在字典中,返回True,否则返回False
>>>info={'name':'monitor', 'sex':'f', 'address':'China'}
>>>info.has_key('id')
>>>False

 

7、字典四种遍历方式
(1)遍历字典的key(键)

dict={'name':'张三','age':20}
for key in dict.keys():
print('key:%s,value:%s'%(key,dict[key]))
#key:name,value:张三
#key:age,value:20

 

(2)遍历字典的value(值)

for value in dict.values():
print('value:%s'%value)
# value:张三
# value:20

 

(3)遍历字典的项(元素)

#item是一个元组
for item in dict.items():
print(item) 
#('name', '张三')
#('age', 20)

 

(4)遍历字典的key-value(键值对)
#注意区别 item()和items()

for key,value in dict.items():
print('key=%s,value=%s'%(key,value))
# key=name,value=张三
# key=age,value=20

 

小结:可变类型与不可变类型
1、可变类型,值可以改变:
列表 list
字典 dict
set (没有value的字典)

2、不可变类型,值不可以改变:
数值类型 int, long, bool, float
字符串 str
元组 tuple

3、集合类型

列表(list)

a=[]

先后顺序,有下标位[index],可以重复,可变类型

元组(tuple)

a=()

有先后顺序,有下标位,元素可以重复,不可变(只能查)

字典(dict)

a={key:value}

没有先后顺序,没有下标,key不可重复,value可以,可变类型

集合(set)

a=set()

没有先后顺序,没有下标,不可重复,可变类型

参考:

Python学习笔记

posted @ 2019-05-03 16:57  cac2020  阅读(584)  评论(0编辑  收藏  举报