python学习笔记4-核心类型-字典

一、字典介绍
字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型。列表是有序的对象结合，字典是无序的对象集合。两者之间的
区别在于：字典当中的元素是通过键来存取的，而不是通过偏移存取。
1、字典的主要属性
*通过键而不是偏移量来读取
字典有时称为关联数组或者哈希表。它们通过键将一系列值联系起来，这样就可以使用键从字典中取出一项。如果列表一样可以使用索引
操作从字典中获取内容。
*任意对象的无序集合
与列表不同，保存在字典中的项并没有特定的顺序。实际上，Python将各项从左到右随机排序，以便快速查找。键提供了字典中项的象征
性位置（而非物理性的）。
*可变，异构，任意嵌套
与列表相似，字典可以在原处增长或是缩短（无需生成一份拷贝），可以包含任何类型的对象，支持任意深度的嵌套，可以包含列表和其他
字典等。
*属于可变映射类型
通过给索引赋值，字典可以在原处修改。但不支持用于字符串和列表中的序列操作。因为字典是无序集合，根据固定顺序进行操作是行不
通的（例如合并和分片操作）。字典是唯一内置的映射类型（键映射到值得对象）。
*对象引用表（哈希表）
如果说列表是支持位置读取对象的引用数组，那么字典就是支持键读取无序对象的引用表。从本质上讲，字典是作为哈希表（支持快速检索的
数据结构）来实现的。一开始很小，并根据要求而增长。此外，Python采用最优化的哈希算法来寻找键，因此搜索是很快速的。和列表一样
字典存储的是对象引用。

2、字典的健
1）不允许一个键对应多个值
原则：每个键键值只能对应一个项。一个键对应多个值是不允许的。当有键发生冲突（即字典键重复赋值），取最后（最近）的赋值。
Python并不会因字典中的健存在冲突而产生一个错误，它不会检查键的冲突。
2）键必须是可哈希的。
像列表和字典这样可变类型，由于他们不是可哈希的，所以不能做键。
所有不可变的类型都是可哈希的，因为它们可以作为字典的健。
注意：值相等的数值表示相同的健如1和1.0
元组是不可变的，但是也不能做字典的健，因为元组里面的元素如果是列表或字典时不可哈希，除非元组中只包含数字和字符串这样的不可变参数，才可以做字典中的有效键。

3、常见的字典操作
可以查看库手册或者运行dir(dict)或者help(dict),类型名位dict。当写成常量表达式时，字典以一系列"键:值（key:value)”对形式写出的，
用逗号隔开，用大括号括起来。可以和列表和元组嵌套
操作解释
D1={} 空字典
D={'one':1} 增加数据
D1[key]='class' 增加数据：已经存在就是修改，没有存在就是增加数据
D2={'name':'diege','age':18} 两项目字典
D3={'name':{'first':'diege','last':'wang'},'age':18} 嵌套
D2['name'] 以键进行索引计算
D3['name']['last'] 字典嵌套字典的键索引
D['three'][0] 字典嵌套列表的键索引
D['six'][1] 字典嵌套元组的键索引
D2.has_key('name') 方法：判断字典是否有name键,最新的方式用in/not in 判断
D2.keys() 方法：键列表
list(D) 获取D这个字典的的KEY的 MS按字典顺序排序成一个列表好像也不是>>> list(D) ['job', 'wang', 'name']
D2.values() 方法：值列表
'name' in D2 方法：成员测试：注意使用key来测试
D2.copy() 方法：拷贝
D2.get(key,deault) 方法：默认如果key存在就返回key的value,如果不存在就设置key的value为default。但是没有改变原对象的数据
D2.update(D1) 方法：合并。D1合并到D2,D1没有变化，D2变化。注意和字符串，列表好的合并操作”+“不同
D2.pop('age') 方法：删除根据key删除,并返回删除的value
len(D2) 方法：求长（存储元素的数目)
D1[key]='class' 方法：增加：已经存在的数据就是修改，没有存在就是增加数据
D4=dict(name='diege',age=18) 其他构造技术
dict(zip(keyslist,valslist)) dict([(1, 'a')])dict接受一个由k-v组成的元组作为元素的列表
D5=dict.fromkeys(['a','b'],defaultvalue) 其他构造技术 dict.fromkeys 可以从一个列表读取字典的key 值默认为空，可指定初始值.两个参数一个是KEY列表，一个初始值

二、创建字典
1、直接创建，全部数据一起添加
>>> D={'name':'diege','age':18}
>>> D
{'age': 18, 'name': 'diege'}
2、先创建一个空字典，在逐个添加
>>> D={}
>>> D['name']='diege'
>>> D['age']=18
>>> D
{'age': 18, 'name': 'diege'}
>>> D['age']=19
>>>
{'age': 19, 'name': 'diege'}
同样键不存在是新添加数据，键存在就是修改数据
列表不能通过这样的方法来增加数据，列表只能通过append方法，列表之能通过L[1]='A'这样的方法来修改已存在序列的数据。
3、使用工厂函数dict()的K=V 参数格式
>>> D1=dict(name='diege',age=18)
>>> D1
{'age': 18, 'name': 'diege'}
将数据按按key=value作为参数传递给dict()

4、使用工厂函数dict()的([(K1,V1),(K2,V2])参数格式
dict(mapping) -> new dictionary initialized from a mapping object's (key, value) pairs
>>> dict([('name','tom'),('age',23)])
{'age': 23, 'name': 'tom'}
这里将每一个数据(属性），做为元组放到一个列表里传递给dict函数
dict(列表，列表里是每一个key组成的元组)
高级用法 zip函数把程序运行动态获得的键和值列表合并在一起（例如分析数据文件字段）
可以用zip()将两个元组或列表组合好K,V的元组参数传递给dict()
>>> keyslist=['shell','sql']
>>> valslist=[['s1','k1','all'],['s1','k1','all']]
>>> D=dict(zip(keyslist,valslist))
>>> D
{'shell': ['s1', 'k1', 'all'], 'sql': ['s1', 'k1', 'all']}
也等同于：dict(map(None,keyslist,keyslist))

5、使用字典的fromkeys方法创建一个默认字典
dict.fromkeys(seq,DefautValue)
第一个参数为列表或者元组（元素是可哈希做键），第二个参数为产生的各个字典的默认值，不指定为None
>>> D=dict.fromkeys(['name','age'])
>>> D
{'age': None, 'name': None}
创建只有key没有value的字典。
>>> dict.fromkeys(('name','age'),'jin')
{'age': 'jin', 'name': 'jin'}

5种方法的选择技巧
*如果可以事先拼除整个字典，那么第一种是很方便的。
*如果需要一次动态地建立字典的一个字段，第二种比较合适
*第三种关键字形式所需的代码比常量少，【但是键必须是都是字符串才可行】
*如果需要在程序运行时把键和值逐步建成序列。第四中比较有用。
*如果所有键的值都相同，可以使用特殊形式对字典进行初始化。简单传入一个键列表，以及所有键的初始值（默认为空）

三、访问字典
1、通过key直接访问
>>> D['age']
18
2、多层通过多个key
D[Key1][key2]

3、便利一个字典
#for key in Dict1.keys():
for key in Dict1:
print 'key=%s,value=%s' %(key,Dict1[key])\

4、访问字典时键不存在会报错
避免这样的错误，需要判断可用Dict.has_key(key1)
先判断，有才读取。现在基本使用in或not in操作符判断

四、更新字典-原处修改字典
1、修改一个元素
给字典添加一个K:V 如果这个K存在就是修改更新字典。
1）增加数据
>>> D['age']=18
>>> D
{'age': 18, 'name': 'diege'}
>>> D1['age']=19
>>> D1
{'age': 19, 'name': 'diege'}
同样键不存在是新添加数据，键存在就是修改数据

五、删除字典和删除字典中的元素
1、函数字典中的元素
del dict[key]
>>> D
{'shell': ['s1', 'k1', 'all'], 'sql': ['s1', 'k1', 'all']}
>>> del D['shell']
>>> D
{'sql': ['s1', 'k1', 'all']}
2、删除字典对象
>>> del D
>>> D
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'D' is not defined
3、清除所有字典数据
>>> D={'name':'jin','age':18}
>>> D.clear()
>>> D
{}

六、映射类型操作符
1、标准类型操作符
字典也是对象，所以可以使用标准类型操作符
>,>=,<,<=,==,!=,<>
字典比较算法
1）首先比较字典长度，字典长的大
2）字典长度一样，比较字典的健，按keys()方法顺序比较
当两个键不匹配时比较，对不匹配的健进行比较，dict1中第一同的健的值大于dict2时 cmp()返回1
3）字典长度相同键完全匹配时比较相同键对应的值 dict1相同键的值大于dict2时 cmp()返回1
4) 字典长度相同键完全匹配，值完全匹配时返回为0

2、映射类型操作符
1）字典的健查找操作符([])
d[k]=v 通过k键给字典中某元素赋V
d[k] 通过k键查询字典中某元素的值
>>> D['sex']='man'
>>> D['sex']
'man'
2)(键)成员关系操作（in,not in)
>>> D={'name':'jin','age':18}
>>> 'name' in D
True
>>> 'name' not in D
False

七、映射的内建函数和工厂函数
(一)、标准类型函数
type()
str()
cmp()
(二)映射相关函数
1)、dict 创建字典对象
2)、len() 取长
>>> len(D)
3）、hash()

八、映射类型内建方法（字典的方法）
方法名字操作
判断
dict.has_key(key) 如果键(key)在字典中存在，返回True，否则返回False. 在Python2.2
版本引入in 和not in 后，此方法几乎已废弃不用了，但仍提供一个
可工作的接口。
创建
dict.copy() 返回字典(浅复制)的一个副本
dict.fromkeysc(seq,val=None) 创建并返回一个新字典，以seq 中的元素做该字典的键，val 做该字
典中所有键对应的初始值(如果不提供此值，则默认为None)
修改
dict.update(dict2)a 将字典dict2 的键-值对添加到字典dict
默认值
dict.get(key,default=None) 对字典dict 中的键key,返回它对应的值value，如果字典中不存在此
键，则返回default 的值(注意，参数default 的默认值为None)
dict.setdefault(key,default=None)e 和方法set()相似，如果字典中不存在key 键，由dict[key]=default 为
它赋值。
查看
dict.items() 返回一个包含字典中(键, 值)对元组的列表
dict.keys() 返回一个包含字典中键的列表
dict.values() 返回一个包含字典中所有值的列表
dict.iter*() 方法iteritems(), iterkeys(), itervalues()与它们对应的非迭代方法
一样，不同的是它们返回一个迭代子，而不是一个列表。
删除
dict.pop(key[, default]) c 和方法get()相似，如果字典中key 键存在，删除并返回dict[key]，
如果key 键不存在，且没有给出default 的值，引发KeyError 异常。
dict.clear() 删除字典中所有元素

1、判断方面
1）、键存在判断-参数使用key
dict.has_key(key) 如果键(key)在字典中存在，返回True，否则返回False. 在Python2.2
版本引入in 和not in 后，此方法几乎已废弃不用了，但仍提供一个
>>> D.has_key('name')
True

2、查看方面
字典keys,valuse和items方法分别返回字典的键列表,值列表和(key,value)对元组
dict.items() 返回一个包含字典中(键, 值)对元组的列表
dict.keys() 返回一个包含字典中键的列表
dict.values() 返回一个包含字典中所有值的列表
dict.iter*() 方法iteritems(), iterkeys(), itervalues()与它们对应的非迭代方法一样，不同的是它们返回一个迭代子，而不是一个列表
>>> D={'name':'diege','age':18}
1）、字典的键查看返回键的列表
key列表
>>> D.keys()
['age', 'name']
2）、字典的值查看返回值的列表
value列表
>>> D.values()
[18, 'diege']
3）、K,V查看 K,V组成的元组列表
K,V元组的列表
>>> D.items()
[('age', 18), ('name', 'diege')]

【【【下面这几个没有？？？】】】
>>> D.viewkeys()
dict_keys(['class', 'name', 'level'])
>>> D.viewvalues()
dict_values([2, 'diege', 2012])
>>> D.viewitems()
dict_items([('class', 2), ('name', 'diege'), ('level', 2012)])

3、默认值
dict.get(key,default=None) 对字典dict 中的键key,返回它对应的值value，如果字典中不存在此
键，则返回default 的值(注意，参数default 的默认值为None)
dict.setdefault(key,default=None)e 和方法set()相似，如果字典中不存在key 键，由dict[key]=default 为
它赋值。

4、创建方面
1)、拷贝
D2.copy()
2)dict.fromkeysc(seq,val=None) 创建并返回一个新字典，以seq 中的元素做该字典的键，val 做该字
典中所有键对应的初始值(如果不提供此值，则默认为None)

5、删除方面
1）dict.pop('key')根据键删除
pop方法是从字典中删除一个键并返回它的值
>>> D.pop('age')
18
方法是从字典中删除一个键并返回它的值
从字典前面一对K:V的方式删除，并返回K,V合成的元组
2）dict.popitem() D3.popitem()
>>> D3.popitem() 不需要参数，从第一对K:V 开始删除
('age', 18)
3)dict.clear()清空字典所有数据
D1.clear()
4)使用del
使用del 【del属于什么？】
>>> del D['age']
18
>>> del D

5、合并数据 dict1.update(dict2)
dict.update(dict2)a 将字典dict2 的键-值对添加到字典dict
D2.update(D1) 方法：合并。D1合并到D2,D1没有变化，D2变化。注意和字符串，列表好的合并操作”+“不同
>>> D1
{'name': 'diege'}
>>> D2
{'class': 2, 'level': 2012}
>>> D2.update(D1)
>>> D1
{'name': 'diege'}
>>> D2
{'class': 2, 'name': 'diege', 'level': 2012}

6、语言表
>>> table={'Python':'Guido',
... 'Perl':'Larry',
... 'Tcl':'John'}
for lang in table:
... print lang,'\t',table[lang]
...
Python Guido
Tcl John
Perl Larry
因为字典并非序列，无法像字符串和列表钠盐直接通过一个for语句迭代他们。但如果要遍历字典的键列表很容易。调用字典的keys()方法，
返回经过排序之后所有键的列表。再用for循环进行迭代。
实际上，Python也能然给你遍历字典的键的列表，而并不用在多数for循环中调用keys方法.就任何字典D而言，写成for key in D:和写成
完整的for key in D.keys()：效果是一样的
>>> for key in table:
... print key
...
Python
Tcl
Perl
>>> for key in table.keys():
... print key
...
Python
Tcl
Perl
>>> for key in table.values():
... print key
...
Guido
John
Larry

八、字典用法注意事项
*序列运算无效。无法有序合并和分片
*对新索引赋值会增加项。
*键不一定总是字符串。任何不可变对象都可以（也就是不是列表）
1、使用字典模拟灵活的列表
当使用列表的时，对在列表末尾外的偏移赋值是非法的。
>>> L=[]
>>> L[99]='diege'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: list assignment index out of range
虽然可以使用重复预先分配足够的大的列表（例如 [0]*100）。但也可以使用字典来坐类似的事。这样就不需要这样的空间分配了。
使用整数键时，字典可以效仿列表再偏移赋值时增长
>>> [0]*100
>>> L=[0]*100
>>> L[99]='diege'
>>> D={}
>>> D[99]='diege'
>>> D[99]
'diege'
这样的不用将来可能会用到的会被赋值的所有位置都分配空间。这样字典很像更具灵活性的列表。
2、字典用于稀疏数据结构
例如多维数组中只有少数位置上有存储的值
>>> M={}
>>> M[(2,3,4)]=88
>>> M[(7,8,9)]=99
>>> X=2;Y=3;Z=4
>>> M[(X,Y,Z)]
88
>>> M
{(2, 3, 4): 88, (7, 8, 9): 99}
这个数组中只有两个位置(2,3,4),(7,8,9)有值，其他位置都未空。键是元组，他们记录非空元素的坐标。我们并不是分配一个庞大而几乎为空的
三维矩阵，而是使用一个简单的练个元素的字典。通过这一方式读取空元素的时，会触发键不存在的异常。因为这些元素实质上并没有被存储。
>>> M[(5,6,7)]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: (5, 6, 7)
3、避免missing-key错误
读取不存在的键的错误在稀疏矩阵中很常见。然而可能并不希望程序因为这一次错误而被关闭。这里有三种方式可以让我们填入默认值而不会出现这样
的错误提示，
1、）使用if语句预先对键进行测试。
>>> if M.has_key((5,6,7)):
... print M[(5,6,7)]
... else:
... print 0
...
0
2)、使用try语句明确地捕获并修复这一异常。
>>> try:
... print M[(5,6,7)]
... except KeyError:
... print 0
...
0
3）、使用get方法为不存在的键提供一个默认值
>>> M.get((2,3,4),0)
88
>>> M.get((5,6,7),0)
0
从编程的需要方面来说，get方法是三者中最简捷的。
4、使用字典作为“记录”
一般说来，字典可以取代搜索数据结构（因为用键进行索引是一种搜索操作），并且可以表示多种结构化信息的类型。例如，字典是在程序范围中多种描述某一项
属性的方法之一。也就是说，它们能偶扮演其他语言中的“记录”和结构相同的角色。
随时间通过向新键赋值来填写字典的列子
>>> rec={}
>>> rec['name']='diege'
>>> rec['age']=28
>>> rec['job']='sa/db'
>>> print rec['name']
diege
特别是在嵌套的时候，Python的内建数据类型可以很轻松地表达结构化信息。使用字典来捕获对象的属性，但是它是一次性写好的，
而且嵌套了一个列表和一个字典来表达结构化属性的值。
>>> offer={'name':'diege','jobs':['sa','dba'],'web':'www.skylog.cn/~diege','home':{'state':'SH','zip':8088}}
当去读嵌套对象的元素时，只要简单地吧索引操作串起来就可以了
>>> offer['name']
'diege'
>>> offer['jobs'][1]
'dba'
>>> offer['home']['state']
'SH

posted on 2012-10-02 18:55 @Jin 阅读(667) 评论(0) 编辑收藏举报

刷新页面返回顶部

一直在路上一直在追寻