python中list和dict
字典(Dictionary)是一种映射结构的数据类型,由无序的“键-值对”组成。字典的键必须是不可改变的类型,如:字符串,数字,tuple;值可以为任何python数据类型。
1、新建字典
1
2
3
|
>>> dict1 = {} #建立一个空字典 >>> type (dict1) < type 'dict' > |
2、增加字典元素:两种方法
1
2
3
4
5
6
7
8
|
>>> dict1[ 'a' ] = 1 #第一种 >>> dict1 { 'a' : 1 } #第二种:setdefault方法 >>> dict1.setdefault( 'b' , 2 ) 2 >>> dict1 { 'a' : 1 , 'b' : 2 } |
3、删除字典
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
#删除指定键-值对 >>> dict1 { 'a' : 1 , 'b' : 2 } >>> del dict1[ 'a' ] #也可以用pop方法,dict1.pop('a') >>> dict1 { 'b' : 2 } #清空字典 >>> dict1.clear() >>> dict1 #字典变为空了 {} #删除字典对象 >>> del dict1 >>> dict1 Traceback (most recent call last): File "<interactive input>" , line 1 , in <module> NameError: name 'dict1' is not defined |
4、字典的方法
1)get(key,default=None)
返回键值key对应的值;如果key没有在字典里,则返回default参数的值,默认为None
1
2
3
4
5
6
7
8
9
10
|
>>> dict1 #空的字典 {} >>> dict1.get( 'a' ) #键‘a'在dict1中不存在,返回none >>> dict1.get( 'd1' , 'no1' ) #default参数给出值'no1',所以返回'no1' 'no1' >>> dict1[ 'a' ] = 'no1' #插入一个新元素 >>> dict1 { 'a' : '1111' } >>> dict1.get( 'a' ) #现在键'a'存在,返回其值 '1111' |
2)clear 清空字典
3)has_key(key) 如果key出现在dict里则返回True;否则返回False
1
2
3
4
5
6
|
>>> dict1 { 'a' : '1111' } >>> dict1.has_key( 'b' ) False >>> dict1.has_key( 'a' ) True |
4)items 返回dict的(键,值)tuple对的一个列表
1
2
3
4
|
>>> dict1 { 'a' : 'no1' , 'b' : '2222' } >>> dict1.items() [( 'a' , 'no1' ), ( 'b' , '2222' )] |
5)keys 返回dict的键列表
6)values 返回dict的值列表
1
2
3
4
5
6
|
>>> dict1 { 'a' : 'no1' , 'b' : '2222' } >>> dict1.keys() [ 'a' , 'b' ] >>> dict1.values() [ 'no1' , '2222' ] |
7)setdefault(key,default=None)
如果dict中有key,则返回key值,如果没有找到key,则在dict中加上该key,值由default参数给出,默认None
8)update(dict2)
把dict2的元素加入到dict中去,键字重复时会覆盖dict中的键值
1
2
3
4
5
6
7
|
>>> dict2 { 'c' : '3333' , 'b' : 'no2' } >>> dict1 #dict2和dict1的键‘b'重复 { 'a' : 'no1' , 'b' : '2222' } >>> dict1.update(dict2) #调用update后,dict1的键'b'值被覆盖了 >>> dict1 { 'a' : 'no1' , 'c' : '3333' , 'b' : 'no2' } |
9)popitem 删除任意键-值对,并返回该键-值对,如字典为空,则产生异常
1
2
3
4
5
6
7
8
9
10
|
>>> dict1 { 'b' : 'no2' } >>> dict1.popitem() ( 'b' , 'no2' ) >>> dict1 {} >>> dict1.popitem() Traceback (most recent call last): File "<interactive input>" , line 1 , in <module> KeyError: 'popitem(): dictionary is empty' |
10)pop(key,[d]) 删除指定键字的键-值对,并返回该键对应的值
1
2
3
4
5
6
|
>>> dict1 { 'a' : 'no1' , 'c' : '3333' , 'b' : 'no2' } >>> dict1.pop( 'a' ) 'no1' >>> dict1 { 'c' : '3333' , 'b' : 'no2' } |
11)copy 返回字典的一个浅拷贝
列表是Python中最基本的数据结构,列表是最常用的Python数据类型,列表的数据项不需要具有相同的类型。列表中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。
一、创建一个列表
只要把逗号分隔的不同的数据项使用方括号括起来即可。如下所示:
list2 = [1, 2, 3, 4, 5 ];
list3 = ["a", "b", "c", "d"];
与字符串的索引一样,列表索引从0开始。列表可以进行截取、组合等。
二、访问列表中的值
使用下标索引来访问列表中的值,同样你也可以使用方括号的形式截取字符,如下所示:
list1 = ['physics', 'chemistry', 1997, 2000];
list2 = [1, 2, 3, 4, 5, 6, 7 ];
print "list1[0]: ", list1[0]
print "list2[1:5]: ", list2[1:5]
以上实例输出结果:
list2[1:5]: [2, 3, 4, 5]
三、更新列表
你可以对列表的数据项进行修改或更新,你也可以使用append()方法来添加列表项,如下所示:
list = ['physics', 'chemistry', 1997, 2000];
print "Value available at index 2 : "
print list[2];
list[2] = 2001;
print "New value available at index 2 : "
print list[2];
以上实例输出结果:
1997
New value available at index 2 :
2001
四、删除列表元素
可以使用 del 语句来删除列表的的元素,如下实例:
list1 = ['physics', 'chemistry', 1997, 2000];
print list1;
del list1[2];
print "After deleting value at index 2 : "
print list1;
以上实例输出结果:
After deleting value at index 2 :
['physics', 'chemistry', 2000]
五、Python列表脚本操作符
列表对 + 和 * 的操作符与字符串相似。+ 号用于组合列表,* 号用于重复列表。
如下所示:
Python 表达式 | 结果 | 描述 |
---|---|---|
len([1, 2, 3]) | 3 | 长度 |
[1, 2, 3] + [4, 5, 6] | [1, 2, 3, 4, 5, 6] | 组合 |
['Hi!'] * 4 | ['Hi!', 'Hi!', 'Hi!', 'Hi!'] | 重复 |
3 in [1, 2, 3] | True | 元素是否存在于列表中 |
for x in [1, 2, 3]: print x, | 1 2 3 | 迭代 |
六、Python列表截取
Python的列表截取与字符串操作类型,如下所示:
操作:
Python 表达式 | 结果 | 描述 |
---|---|---|
L[2] | 'SPAM!' | 读取列表中第三个元素 |
L[-2] | 'Spam' | 读取列表中倒数第二个元素 |
L[1:] | ['Spam', 'SPAM!'] | 从第二个元素开始截取列表 |
七、Python列表操作的函数和方法
列表操作包含以下函数:
1、cmp(list1, list2):比较两个列表的元素
2、len(list):列表元素个数
3、max(list):返回列表元素最大值
4、min(list):返回列表元素最小值
5、list(seq):将元组转换为列表
列表操作包含以下方法:
1、list.append(obj):在列表末尾添加新的对象
2、list.count(obj):统计某个元素在列表中出现的次数
3、list.extend(seq):在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
4、list.index(obj):从列表中找出某个值第一个匹配项的索引位置
5、list.insert(index, obj):将对象插入列表
6、list.pop(obj=list[-1]):移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
7、list.remove(obj):移除列表中某个值的第一个匹配项
8、list.reverse():反向列表中元素
9、list.sort([func]):对原列表进行排序
列表转换成字典
注:列表不能直接使用dict转换成字典。
方法一:使用zip()函数
a = ['a1','a2','a3','a4']
b = ['b1','b2','b3']
d = zip(a,b)
print(dict(d)) # {'a1': 'b1', 'a2': 'b2', 'a3': 'b3'}
将a和b两个列表内的元素两两组合成键值对。
当两个列表的长度不一致时,多出的元素在另一个列表无匹配的元素时就不展示多出的元素。
方法二:使用嵌套列表转换为字典
a = ['a1','a2']
b = ['b1','b2']
c = [a,b]
print(dict(c)) # {'a1': 'a2', 'b1': 'b2'}
# 相当于遍历子列表,如下
dit = {}
for i in c:
dit[i[0]] = i[1]
print(dit)
a和b列表内只能有两个元素,将列表内的元素自行组合成键值对。
字典转换成列表
注:字典可以直接使用list转换成列表。
dit = {'name':'zxf',
'age':'22',
'gender':'male',
'address':'shanghai'}
将字典的key转换成列表
lst = list(dit)
print(lst) # [‘name’, ‘age’, ‘gender’, ‘address’]
将字典的value转换成列表
lst2 = list(dit.values())
print(lst2) # [‘zxf’, ‘22’, ‘male’, ‘shanghai’]
Python语言简洁明了,可以用较少的代码实现同样的功能。这其中Python的四个内置数据类型 list, tuple, dict, set。这里对他们进行一个简明的总结。
List
字面意思就是一个集合,在Python中List中的元素用中括号[]来表示,可以这样定义一个List:
L = [12, 'China', 19.998]
可以看到并不要求元素的类型都是一样的。当然也可以定义一个空的List:
L = []
Python中的List是有序的,所以要访问List的话显然要通过序号来访问,就像是数组的下标一样,一样是下标从0开始:
>>> print L[0] 12
千万不要越界,否则会报错
>>> print L[3] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: list index out of range
List也可以倒序访问,通过“倒数第x个”这样的下标来表示序号,比如-1这个下标就表示倒数第一个元素:
>>> L = [12, 'China', 19.998] >>> print L[-1] 19.998
-4的话显然就越界了
>>> print L[-4] Traceback (most recent call last): File "<pyshell#2>", line 1, in <module> print L[-4] IndexError: list index out of range >>>
List通过内置的append()方法来添加到尾部,通过insert()方法添加到指定位置(下标从0开始):
>>> L = [12, 'China', 19.998] >>> L.append('Jack') >>> print L [12, 'China', 19.998, 'Jack'] >>> L.insert(1, 3.14) >>> print L [12, 3.14, 'China', 19.998, 'Jack'] >>>
通过pop()删除最后尾部元素,也可以指定一参数删除指定位置:
>>> L.pop() 'Jack' >>> print L [12, 3.14, 'China', 19.998] >>> L.pop(0) 12 >>> print L [3.14, 'China', 19.998]
也可以通过下标进行复制替换
>>> L[1] = 'America' >>> print L [3.14, 'America', 19.998]
Tuple
Tuple可以看做是一种“不变”的List,访问也是通过下标,用小括号()表示:
>>> t = (3.14, 'China', 'Jason') >>> print t (3.14, 'China', 'Jason')
但是不能重新赋值替换:
>>> t[1] = 'America' Traceback (most recent call last): File "<pyshell#21>", line 1, in <module> t[1] = 'America' TypeError: 'tuple' object does not support item assignment
也没有pop和insert、append方法。
可以创建空元素的tuple:
t = ()
或者单元素tuple (比如加一个逗号防止和声明一个整形歧义):
t = (3.14,)
那么tuple这个类型到底有什么用处呢?要知道如果你希望一个函数返回多个返回值,其实只要返回一个tuple就可以了,因为tuple里面的含有多个值,而且是不可变的(就像是java里面的final)。当然,tuple也是可变的,比如:
>>> t = (3.14, 'China', 'Jason', ['A', 'B']) >>> print t (3.14, 'China', 'Jason', ['A', 'B']) >>> L = t[3] >>> L[0] = 122 >>> L[1] = 233 >>> print t (3.14, 'China', 'Jason', [122, 233])
这是因为Tuple所谓的不可变指的是指向的位置不可变,因为本例子中第四个元素并不是基本类型,而是一个List类型,所以t指向的该List的位置是不变的,但是List本身的内容是可以变化的,因为List本身在内存中的分配并不是连续的。
Dict
Dict是Python中非常重要的数据类型,就像它的字面意思一样,它是个活字典,其实就是Key-Value键值对,类似于HashMap,可以用花括号{}通过类似于定义一个C语言的结构体那样去定义它:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59, 'Paul': 75 } >>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Bart': 59}
可以看到打印出来的结果都是Key:Value的格式,可以通过len函数计算它的长度(List,tuple也可以):
>>> len(d) 4
可以直接通过键值对方式添加dict中的元素:
>>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Bart': 59} >>> d['Jone'] = 99 >>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Jone': 99, 'Bart': 59}
List和Tuple用下标来访问内容,而Dict用Key来访问: (字符串、整型、浮点型和元组tuple都可以作为dict的key)
>>> print d['Adam'] 95
如果Key不存在,会报错:
>>> print d['Jack'] Traceback (most recent call last): File "<pyshell#40>", line 1, in <module> print d['Jack'] KeyError: 'Jack'
所以访问之前最好先查询下key是否存在:
>>> if 'Adam' in d : print 'exist key' exist key
或者直接用保险的get方法:
>>> print d.get('Adam') 95 >>> print d.get('Jason') None
至于遍历一个dict,实际上是在遍历它的所有的Key的集合,然后用这个Key来获得对应的Value:
>>> for key in d : print key, ':', d.get(key) Lisa : 85 Paul : 75 Adam : 95 Bart : 59
Dict具有一些特点:
- 查找速度快。无论是10个还是10万个,速度都是一样的,但是代价是耗费的内存大。List相反,占用内存小,但是查找速度慢。这就好比是数组和链表的区别,数组并不知道要开辟多少空间,所以往往开始就会开辟一个大空间,但是直接通过下标查找速度快;而链表占用的空间小,但是查找的时候必须顺序的遍历导致速度很慢
- 没有顺序。Dict是无顺序的,而List是有序的集合,所以不能用Dict来存储有序集合
- Key不可变,Value可变。一旦一个键值对加入dict后,它对应的key就不能再变了,但是Value是可以变化的。所以List不可以当做Dict的Key,但是可以作为Value:
>>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Jone': 99, 'Bart': 59} >>> d['NewList'] = [12, 23, 'Jack'] >>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 99, 'Lisa': 85, 'Paul': 75}
- Key不可重复。(下面例子中添加了一个'Jone':0,但是实际上原来已经有'Jone'这个Key了,所以仅仅是改了原来的value)
>>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 99, 'Lisa': 85, 'Paul': 75} >>> d['Jone'] = 0 >>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 0, 'Lisa': 85, 'Paul': 75}
Dict的合并,如何将两个Dict合并为一个,可以用dict函数:
>>> d1 = {'mike':12, 'jack':19} >>> d2 = {'jone':22, 'ivy':17} >>> dMerge = dict(d1.items() + d2.items()) >>> print dMerge {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
或者
>>> dMerge2 = dict(d1, **d2) >>> print dMerge2 {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
方法2比方法1速度快很多,方法2等同于:
>>> dMerge3 = dict(d1) >>> dMerge3.update(d2) >>> print dMerge {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
set
set就像是把Dict中的key抽出来了一样,类似于一个List,但是内容又不能重复,通过调用set()方法创建:
>>> s = set(['A', 'B', 'C'])
就像dict是无序的一样,set也是无序的,也不能包含重复的元素。
对于访问一个set的意义就仅仅在于查看某个元素是否在这个集合里面:
>>> print 'A' in s True >>> print 'D' in s False
大小写是敏感的。
也通过for来遍历:
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)]) #tuple for x in s: print x[0],':',x[1] >>> Lisa : 85 Adam : 95 Bart : 59
通过add和remove来添加、删除元素(保持不重复),添加元素时,用set的add()方法:
>>> s = set([1, 2, 3]) >>> s.add(4) >>> print s set([1, 2, 3, 4])
如果添加的元素已经存在于set中,add()不会报错,但是不会加进去了:
>>> s = set([1, 2, 3]) >>> s.add(3) >>> print s set([1, 2, 3])
删除set中的元素时,用set的remove()方法:
>>> s = set([1, 2, 3, 4]) >>> s.remove(4) >>> print s set([1, 2, 3])
如果删除的元素不存在set中,remove()会报错:
>>> s = set([1, 2, 3]) >>> s.remove(4) Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 4
所以如果我们要判断一个元素是否在一些不同的条件内符合,用set是最好的选择,下面例子:
months = set(['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec',]) x1 = 'Feb' x2 = 'Sun' if x1 in months: print 'x1: ok' else: print 'x1: error' if x2 in months: print 'x2: ok' else: print 'x2: error' >>> x1: ok x2: error