第4章 字典:当索引不好用时

  通过名字引用值的数据结构,这种结构类型称为映射(mapping)。字典是Python中唯一内建的映射类型。字典中的值并没有特殊的顺序,但是都存储在一个特定的键(key)里。键可以是数字、字符串甚至是元组。

4.1 字典的使用

  现实中的字典及在Python中的字典都进行了构造,从而可以轻松查到某个特定的词语(key),从而找到它的定义(值)。

  某些情况下,字典比列表更加适用,比如:

  1.表征游戏棋盘的状态,每个键都是由坐标值组成的元组;

  2.存储文件修改次数,用文件名作为键;

  3.数字电话/地址簿

  使用列表实现根据人名查找电话号码的需求:

>>> names = ["Alex","Beth","Cecil","Earl"]
>>> numbers = ["2341","9102","3158","5551"]
>>> numbers[names.index("Cecil")]
'3158'

  这样做虽然可行,但是并不实用。假如phonebook是一个字典,Cecil是一个key,就会如下查询:

>>> phonebook["Cecil"]
3158

4.2 创建和使用字典

  字典可以通过下面的方式创建:

>>> phonebook = {"Alex":"2341","Bech":"9102","Cecil":"3158"}

  字典由多个键及与其对应的值构成的对组成(键key/值values)。例子中,名字是键,电话号码是值。每个键和它的值之间用冒号(:)隔开,项之间用逗号(,)隔开,而整个字典是由一对大括号括起来。空字典(不包括任何项)由两个大括号组成,{}。字典中的键是唯一的,而值并不唯一。

4.2.1 dict函数

  可以用dict函数,通过其他映射(比如其他字典)或者(键,值)这样的序列对建立字典。

>>> items = [("name","alex"),("age","23")]
>>> d = dict(items)
>>> d
{'name': 'alex', 'age': '23'}
>>> d["name"]
'alex'

  dict函数也可以通过关键字参数来创建字典,如下列所示:

>>> d = dict(name="alex",age=23)
>>> d
{'name': 'alex', 'age': 23}

4.2.2 基本字典操作

  字典的基本行为在很多方面与序列(sequence)类似:

  1.len(d)返回字典d中项(键-值对)的数量;

  2.d[k]返回关联到键k上的值;

  3.d[k]=v将值v关联到键k上;

  4.del d[k]删除键k的项;

  5.k in d检查d中是否含有键k的项。

  尽管字典和列表有很多特性相同,但也有下面一些重要的区别。

  1.键类型:字典的键不一定为整数类型(但也可能是),也可能是其他不可变类型,比如浮点型(实型)、字符串或者元组。

  2.自动添加:即使键在字典中不存在,也可以为它分配一个值,建立新的项。而列表(不使用append或其他类似操作的情况下)不能将值关联到列表范围之前的索引上。

  3.成员资格:表达式k in d(d为字典)查找的是键,而不是值。表达式v in l(l为列表)则用来查找值,而不是索引。

>>> x = []
>>> x[42] = "Foobar"
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: list assignment index out of range
>>> x = {}
>>> x[42] = "Foobar"
>>> x
{42: 'Foobar'}
>>>

  代码清单4-1是电话本例子的代码:

#简单的名称、电话、地址数据库,根据输入的人名,查找对应的电话号码或者地址
people = {
    "alex":{
        "phone":"1234",
        "addr":"BeiJing"
},
    "john":{
        "phone":"3456",
        "addr":"HeBei"
},
    "smith":{
        "phone":"2504",
        "addr":"FuNan"
}
}
#设置电话或地址的标签
labels = {
    "phone":"phone number",
    "addr":"address"
}
name = input("Name:")
#查找电话还是地址,输入'p'或者'a'
request = input("phone number(p) or address(a)?")
#使用正确的键:
if request == "p":key = "phone"
if request == "a":key = "addr"
#如果名字是字典中的有效键才打印信息:
if name in people:
    print("%s's %s is %s."%(name,labels[key],people[name][key]))
View Code

4.2.3 字典的格式化字符串

  在第3章,已经见过如何使用字符串格式化功能来格式化元组中的所有值。如果使用(只以字符串作为键的)字典而不是元组来做这个工作,会使字符串格式化更酷一些。在每个转换说明符中的%字符后面,加上(用圆括号括起来的)键,,后面跟上其他说明元素。

>>> phonebook = {"Alex":"2341","Bech":"9102","Cecil":"3158"}
>>> "Cecil's phone number is %(Cecil)s." % phonebook
"Cecil's phone number is 3158."
>>> template = '''<html>
<head><title>%(title)s</title></head>
<body>
<h1>%(title)s</h1>
<p>%(text)s</p>
</body>'''
>>> data = {"title":"My Home Page","text":"Welcome to my home page!"}
>>> print(template % data)
<html>
<head><title>My Home Page</title></head>
<body>
<h1>My Home Page</h1>
<p>Welcome to my home page!</p>
</body>
View Code

4.2.4 字典方法

  字典的方法有:

  1.clear

  clear方法清除字典中所有的项。无返回值(或者返回None)。

>>> d = {}
>>> d["name"] = "alex"
>>> d["age"] = 23
>>> d
{'name': 'alex', 'age': 23}
>>> returned_values = d.clear()
>>> d
{}
>>> print(returned_values)
None

  考虑一下两种情况。下面是第一种

>>> x = {}
>>> y = x
>>> x["key"] = "values"
>>> x
{'key': 'values'}
>>> x = {}
>>> y
{'key': 'values'}
>>>

  然后是第2种情况:

>>> x = {}
>>> y = x
>>> x["key"] = "values"
{'key': 'values'}
>>> x.clear()
>>> y
{}
>>>

  两种情况中,x和y最初对应同一个字典。情况1中,通过将x关联到一个新的空字典来"清空"它,这对y一点影响也没有,它还关联到原先的字典。这可能是所需要的行为,但是如果真的想清空原始字典中所有的元素,必须使用clear方法。正如情况2所示,y随后也被清空了。

  2.copy

  copy方法返回一个具有相同键-值对的新字典(这个方法实现的是浅复制(shallow copy),因为值本身就是相同的,而不是副本)。

>>> x = {"username":"admin","machines":["foo","bar","baz"]}
>>> y = x.copy()
>>> y
{'machines': ['foo', 'bar', 'baz'], 'username': 'admin'}
>>> y["username"] = "mth"
>>> y["machines"].remove("bar")
>>> y
{'machines': ['foo', 'baz'], 'username': 'mth'}
>>> x
{'machines': ['foo', 'baz'], 'username': 'admin'}

  可以看到,当在副本中替换值的时候,原始字典不受影响,但是,如果修改了某个值(原地修改,而不是替换),原始的字典也会改变,因为同样的值也存储在原字典中。为避免这个问题的一种方法就是使用深复制(deep copy),复制其包含所有的值。可以使用copy模块的deepcopy函数来完成操作:

>>> from copy import deepcopy
>>> d = {}
>>> d["names"] = ["alex","john"]
>>> c = d.copy()
>>> dc = deepcopy(d)
>>> d["names"].append("tenglan")
>>> c
{'names': ['alex', 'john', 'tenglan']}
>>> dc
{'names': ['alex', 'john']}

  3.fromkeys

  fromkeys方法适用给定的键建立新的字典,每个键默认对应的值为None。

>>> {}.fromkeys(["name","age"])
{'name': None, 'age': None}
>>>

>>> dict.fromkeys(["name","age"])
{'name': None, 'age': None}
>>>

  第一个例子是先构造了一个空字典,然后调用它的fromkeys方法,建立另外一个字典。也可以直接在所有字典的类型dict上面调用方法。如果不想使用None作为默认值,也可以自己提供默认值。

>>> dict.fromkeys(["name","age"],"unknown")
{'name': 'unknown', 'age': 'unknown'}
>>>

  4.get

  get方法是个更宽松的访问字典项的方法。一般如果试图访问字典中不存在的项时会出错:

>>> d = {}
>>> print (d["name"])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'name'

  而用get就不会:

>>> print (d.get("name"))
None
>>>

  当使用get访问一个不存在的键时,没有任何异常,而得到了None值。自己也可以定"默认"值,替换None:

>>> d.get("name","N/A")
'N/A'

  如果键值存在,get就和普通的字典查询一样:

>>> d["name"] = "alex"
>>> d.get("name")
'alex'

  下面代码演示使用get访问的示例,是4-1程序的修改版本。

#简单的名称、电话、地址数据库,根据输入的人名,查找对应的电话号码或者地址
people = {
    "alex":{
        "phone":"1234",
        "addr":"BeiJing"
},
    "john":{
        "phone":"3456",
        "addr":"HeBei"
},
    "smith":{
        "phone":"2504",
        "addr":"FuNan"
}
}
#设置电话或地址的标签
labels = {
    "phone":"phone number",
    "addr":"address"
}
name = input("Name:")
#查找电话还是地址
request = input("phone number(p) or address(a)?")
#关联用户的输入到相应的标签上,如果输入的信息不是p或者a
key = request
if request == "p":key = "phone"
if request == "a":key = "addr"
#使用get()提供默认值
person = people.get(name,{})
label = labels.get(key,key)
result = person.get(key,"not available")

print("%s's %s is %s."%(name,label,result))

输出结果:
Name:Gumby
phone number(p) or address(a)?weigth
Gumby's weigth is not available.
View Code

  6.items

  items方法将所有的字典项以列表方式返回,这些列表项中的每一项都来自于(键,值)。

>>> d = {"title":"Python Web Site","url":"www.python.org","spam":0}
dict_items([('url', 'www.python.org'), ('title', 'Python Web Site'), ('spam', 0)])

  7.keys

  keys方法将字典中的键以列表形式返回。

>>> info = {'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> info.keys()
dict_keys(['stu1102', 'stu1103'])

  8.values

  values方法以列表的形式返回字典中的值。

>>> info = {'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> info.values()
dict_values(['LongZe Luola', 'XiaoZe Maliya'])

  9.pop

  pop方法用来去除指定的键值。

>>> info = {'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> info.pop("stu1102")
>>> info
{'stu1103': 'XiaoZe Maliya'}

  10.popitem

  随机移除字典中的项

  11.setdefault

  setdefault方法在某种程度上类似于get方法,就是能够获得与给定键相关的值,除此之外,setdefault还能在字典中不含有给定键的情况下设定相应的键值。

>>> d = {}
>>> d.setdefault("name","N/A") #当键值不存在,更新字典
'N/A'
>>> d
{'name': 'N/A'}
>>> d["name"] = "Gumby"
>>> d.setdefault("name","N/A") #当键值存在,返回对应的值
'Gumby'
>>> d
{'name': 'Gumby'}

  当键不存在的时候,setdefault返回默认值并相应的更新字典,如果键存在,就返回与其对应的值,但不改变字典。如果不设定,默认值是None。

  12.update

  update方法可以利用一个字典项更新另外一个字典:

>>> d = {"title":"Python Web Site","url":"http://www.python.org"}
>>> x = {"title":"Python Language Website","changed":"Mar 14 22:02:15 MET 2016"}
>>> d.update(x)
>>> d
{'url': 'http://www.python.org', 'title': 'Python Language Website', 'changed':'Mar 14 22:02:15 MET 2016'}

  新字典中的项会被添加到旧的字典中,若有相同的键则会进行覆盖。

4.3 小结

  本章主要有以下内容:

  映射:映射可以使用任何不可变对象标识元素。最常用的类型是字符串和元组。Python唯一内建的映射类型是字典。

  利用字典格式化字符串:可以通过在格式化说明符中包括名称(键)来对字典应用字符串格式化操作。当在字符格式化中使用元组时,还需要对元组中一个元素都设定"格式化说明符"。

  字典的方法:update,values,key,pop等

4.3.1 本章的新函数

  新函数如表4-1所示。

                 

 

posted @ 2016-12-20 12:12  草丛抡  阅读(201)  评论(0编辑  收藏  举报