13.python中的字典

　　字典其实和之前的元祖和列表功能相似，都是用来储存一系列对象的。也就是一种可变容器，或者是我所比喻的革新派的菜单。

　　但也不是完全相同，我在之前曾经将字典称为特殊的'序列'，是字典拥有序列的部分特性，但是又不符合序列的定义。

　　首先我们来看下字典是如何创建的：

a = {'a':1,'b':2,'c':2}
b = {}
c = dict(a=1)
print a
print b
print c

　　我们可以使用{} 或者dict() 来创建一个字典对象。

　　但字典里面写的是什么？下面我来分析一下。

　　首先，字典是以键值对的形式来储存对象的，即 key:value ,键和值之间用冒号分隔，而每个键值对之间用逗号分隔。

　　这个是时候可以联想一下序列的形式，在序列中，对象之间也是用逗号分隔的，但不同的是，序列是使用索引作为key，且索引是提取定义好的，按照一定顺序的。但是字典中，key是自定义的，相当于我们为对象起一个变量名，只不过变量名在字典的key中是以字符串的形式存在的，就像 c 中的创建方式，变量名为 a ，最终得到的键为 'a'。

　　那是不是字典的键就只能是字符串类型呢？并不是，我们也可以像序列一样用数字作为键。

a = {666:'scolia',}
print a

　　当然，为了提高代码可读性，我在只有单个对象的时候还是用了逗号。

　　元祖和列表也可以作为键吗？

　　答案是：NO!

　虽说几乎所有类型的python对象都能作为键(只要该对象是可哈希的)，但是一般还是以数字或者字符串最为常用。

　　看到这里，我们可能会想字典无非就是高级一点的列表而已，为什么又不是序列呢？

　　因为字典是无序的。

　　我们看变量 a 中的字典：

a = {'a':1,'b':2,'c':2}

　　我们在创建的时候明明是按一定顺序排列的，为什么输出的时候顺序却乱了？

　　这正是字典无序性的体现。

　　首先序列之所以被称为序列：正如其名，有序的、队列式的。我们在序列中逐一放入元素的时候，会自动的按照从左到右进行编号，也就是索引，而每一个索引对应一个对象。而字典却失去了索引的约束，用了自定义的键来取代，当我们在获取对象时也是用键名来获取，只要知道了键名，那么对象在字典中的哪个位置也无所谓了，所以字典是无序的，也就不能称为序列。

　　但我们依然可以将其想象为是一种高级的列表，只不过这个列表的索引是自定义的，无序的。

　　另外，当字典中的出现了同名的键会怎么办？

a = {'scolia': 1,'scolia':2,'scolia':3}
print a

　　就像变量命名一样，前面的都被冲突掉了。

　　这时又有同学问：不是说字典是无序的吗？我怎么知道谁在前谁在后？

　　我曾经把索引比作是特殊的变量名，只不过普通的变量名不能只是数字，而索引则是通过数字去内存取值。同理，字典里的键也可以看作是变量名，在字典里的元素打包成一个字典之前，先进行了变量的赋值操作，而对同一个变量进行多次赋值相当于切换其在内存的引用，只有最后一个赋值有效，这里也是一样的。在键值对创建的时候，按照我们写时候的顺序先进行赋值操作，然后保存在字典中，保存之后才是无序的。

　　那么值相同的时候是否也是同一个对象呢？

a = {'a':300,'b':300}
print id(a['a']),id(a['b'])

　　看来是的，和序列中的一样，也是节省内存的优化。

　　接下来我们就可以开始学习字典的内置方法了，首先按老规矩先使用 help(dict) 查看其帮助文档。

Help on class dict in module __builtin__:

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)
 |  
 |  Methods defined here:
 |  
 |  __cmp__(...)
 |      x.__cmp__(y) <==> cmp(x,y)
 |  
 |  __contains__(...)
 |      D.__contains__(k) -> True if D has a key k, else False
 |  
 |  __delitem__(...)
 |      x.__delitem__(y) <==> del x[y]
 |  
 |  __eq__(...)
 |      x.__eq__(y) <==> x==y
 |  
 |  __ge__(...)
 |      x.__ge__(y) <==> x>=y
 |  
 |  __getattribute__(...)
 |      x.__getattribute__('name') <==> x.name
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(...)
 |      x.__gt__(y) <==> x>y
 |  
 |  __init__(...)
 |      x.__init__(...) initializes x; see help(type(x)) for signature
 |  
 |  __iter__(...)
 |      x.__iter__() <==> iter(x)
 |  
 |  __le__(...)
 |      x.__le__(y) <==> x<=y
 |  
 |  __len__(...)
 |      x.__len__() <==> len(x)
 |  
 |  __lt__(...)
 |      x.__lt__(y) <==> x<y
 |  
 |  __ne__(...)
 |      x.__ne__(y) <==> x!=y
 |  
 |  __repr__(...)
 |      x.__repr__() <==> repr(x)
 |  
 |  __setitem__(...)
 |      x.__setitem__(i, y) <==> x[i]=y
 |  
 |  __sizeof__(...)
 |      D.__sizeof__() -> size of D in memory, in bytes
 |  
 |  clear(...)
 |      D.clear() -> None.  Remove all items from D.
 |  
 |  copy(...)
 |      D.copy() -> a shallow copy of D
 |  
 |  fromkeys(...)
 |      dict.fromkeys(S[,v]) -> New dict with keys from S and values equal to v.
 |      v defaults to None.
 |  
 |  get(...)
 |      D.get(k[,d]) -> D[k] if k in D, else d.  d defaults to None.
 |  
 |  has_key(...)
 |      D.has_key(k) -> True if D has a key k, else False
 |  
 |  items(...)
 |      D.items() -> list of D's (key, value) pairs, as 2-tuples
 |  
 |  iteritems(...)
 |      D.iteritems() -> an iterator over the (key, value) items of D
 |  
 |  iterkeys(...)
 |      D.iterkeys() -> an iterator over the keys of D
 |  
 |  itervalues(...)
 |      D.itervalues() -> an iterator over the values of D
 |  
 |  keys(...)
 |      D.keys() -> list of D's keys
 |  
 |  pop(...)
 |      D.pop(k[,d]) -> v, remove specified key and return the corresponding value.
 |      If key is not found, d is returned if given, otherwise KeyError is raised
 |  
 |  popitem(...)
 |      D.popitem() -> (k, v), remove and return some (key, value) pair as a
 |      2-tuple; but raise KeyError if D is empty.
 |  
 |  setdefault(...)
 |      D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D
 |  
 |  update(...)
 |      D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
 |      If E present and has a .keys() method, does:     for k in E: D[k] = E[k]
 |      If E present and lacks .keys() method, does:     for (k, v) in E: D[k] = v
 |      In either case, this is followed by: for k in F: D[k] = F[k]
 |  
 |  values(...)
 |      D.values() -> list of D's values
 |  
 |  viewitems(...)
 |      D.viewitems() -> a set-like object providing a view on D's items
 |  
 |  viewkeys(...)
 |      D.viewkeys() -> a set-like object providing a view on D's keys
 |  
 |  viewvalues(...)
 |      D.viewvalues() -> an object providing a view on D's values
 |  
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  __hash__ = None
 |  
 |  __new__ = <built-in method __new__ of type object>
 |      T.__new__(S, ...) -> a new object with type S, a subtype of T

dict

　　按照其功能可分为：

　　1.大于、小于、等于等比较运算符

　　2.成员判断

　　3.内置函数相关的（参考这里）

　　4.增删改查相关操作

1.比较运算符

　　因为字典不是序列了，所以就不能像序列一样按照索引逐个打擂台了。

　　不过大小的比较规则还是一样的，只是上场的顺序未知而已。

　　那到底比较的时候顺序是怎么样的，看下面的例子。

a = {'a':1,'b':2,'c':3}
for x in a:
    print x

　　我们使用for循环来看看比较时的顺序，可以看出，顺序是无可预估的，虽然这里只有三个键值对，貌似有一定的规律，但是一旦里面的对象多起来，就得不出规律了，而且不可能每次比较的时候都要自己看一下里面是怎么比的，那样实在太累，所以我们得出一个结论：少用字典间的比较，要比较用序列去。

　　另外这里补充一点：当我们使用for循环时，我们得到的是键名，如果我们要取到值怎么办？可以像下面这样写：

a = {'a':1,'b':2,'c':3}
for x in a:
    print a[x]

　　当然还有其他写法，看完内置方法后自己总结吧。

2.成员判断

1. in

　在序列中判断里面有没有某个元素时使用的是 in ，但细心的同学会发现，在帮助文档中并没有出现 in ，是不是in不能用了呢？

　　看下面这个例子：

a = {'a':1,'b':2, 3:30}
b = 2
print b in a
print 2 in a
print 'b' in a
print 3 in a

　　还可以使用，但是这里 in 只能判断字典里是否有哪个键，而不是键对应的值。

2. D.has_key(k) -> True if D has a key k, else False

　　和 in 一样，判断里面是否有某个键，返回布尔值。

a = {'a':1,'b':2, 3:30}
print a.has_key('b')
print a.has_key(3)

3. D.__contains__(k) -> True if D has a key k, else False

　　判断是否有某个键，和上面的一样，就不多说明了。

4.判断字典里面是否有某个对象。

　　字典中并没有内置的方法能直接判断，但是我们可以自己写一个。

a = {'a':1,'b':2, 3:30}
b = 30
c = a.values()  #返回一个由字典的值组成的列表
print c     #同样我们无法预估字典里的顺序
print b in c

　　我们转了一个弯，这就要考验思维的灵活性了。

3.增

1. x.__setitem__(i, y) <==> x[i]=y

　这个和列表中的不同，列表的这个写法是修改元素，如果给的索引不存在是会报错的。但在字典中，这个方法除了可以用来修改元素之外，如果给定的键不存在，则会在字典中创建这个键值对。

a = {'a':1,'b':2, 3:30}
a['scolia'] = 'good'
print a

2. dict.fromkeys(S[,v]) -> New dict with keys from S and values equal to v. v defaults to None.

　　这个方法用于创建新的字典对象，我这里将其归类到这里。

　　其中，S 为一个键的序列，v为值，将为S所指定的所有键设置同一个值，默认为None。

a = dict.fromkeys(('scolia'),123)
b = dict.fromkeys(('scolia',))
print a
print b

　　注意S的写法，这就是为什么在元祖只有一个元素的时候一定要加一个逗号，否则解释器会将其当作传参，将字符串传进去，而字符串也是一个序列，所以没一个字符都被当做一个键，就造成了a的输出了。将S写成一个列表就不会有这样的错误，但元祖消耗的资源少，具体选择看个人。

a = dict.fromkeys(['scolia'],123)
print a

a = {'scolia': 1,'good':1,1:0}
print a.fromkeys(('k'),123)
print a

　　这里很特殊，创建的对象并没有添加到原字典中，而是所为一个返回值。

3. D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D

　　这是一个集查询、修改、增加键值对的方法。

a = dict.fromkeys(['scolia'],123)
print a.setdefault('s',123)
print a

　　这里解释这个方法的细节：首先k是必须的参数，如果只给k一个参数，则d默认为None，也可以指定d的值。

a = dict.fromkeys(['scolia'],123)
print a.setdefault('scolia')
print a.setdefault('s')
print a

　　其执行顺序为：

　　1.先用给定的k看看里面有没有对应的键，有就返回这个键的值。

　　2.如果没有k这个键，则创建这个键，然后用d作为其值，如果d没给就默认为None（空对象）。

4.删

1. del x[y]

　　用del关键字删除对象，在列表中讲过，只不过y从索引变成了键名。这里不再重复。

2. D.clear() -> None. Remove all items from D.

　　删除整个字典里的元素，返回值为None。

a ={'scolia':123}
print a.clear()
print a

　　不需要传参，但要注意就算清空了字典里的所以元素，最后得到的还是一个空字典，而不是空对象None。

3. D.pop(k[,d]) -> v, remove specified key and return the corresponding value.

　　删除指定的键值对，并返回相应的值。如果没找到键返回d，若连d都没给，则触发KeyError错误。

a ={'scolia':123,123:321}
print a.pop(123)
print a.pop(666,'没找到')
print a.pop(999)

4. D.popitem() -> (k, v), remove and return some (key, value) pair as a 2-tuple; but raise KeyError if D is empty.

　　删除字典中的第一个元素，并将其按一个元祖返回，如果字典为空则触发KeyError错误

a ={'scolia':123,123:321,555:777}
print a
print a.popitem()
print a

　　但还是那句话，字典中元素的顺序是未知的，谁知道第一个是什么，所以多配合迭代循环使用，逐个删除掉。

5.查

1. D.keys() -> list of D's keys

　　返回一个由键组成的列表

a ={'scolia':123,123:321,555:777}
print a.keys()

2. D.values() -> list of D's values

　　返回一个由值组成的列表

a ={'scolia':123,123:321,555:777}
print a.values()

3. D.items() -> list of D's (key, value) pairs, as 2-tuples

　　返回一个由键值组成的元祖的列表。

a ={'scolia':123,123:321,555:777}
print a.items()

4. D.iterkeys() -> an iterator over the keys of D

　　返回一个包含所有键的迭代对象

a ={'scolia':123,123:321,555:777}
b = a.iterkeys()
for x in b:
    print x

5. D.itervalues() -> an iterator over the values of D

　　返回一个包含所有值的迭代对象，原理同上，不再详细说明。

6. D.iteritems() -> an iterator over the (key, value) items of D

　　返回一个包含键值对元祖的迭代对象，同理。另外注意下元祖的迭代循环技巧。

7. D.viewkeys() -> a set-like object providing a view on D's keys

　　返回一个键的类似集合的对象。集合的作用是去除重复，但字典对于键的重复已经有相应处理，感觉意义不大。

a = {'scolia': 1,'scolia':2,1:123}
print a.viewkeys()
print type(a.viewkeys())

8. D.viewvalues() -> an object providing a view on D's values

　　返回一个值的视图对象，注意不是集合对象，没有去重作用。

a = {'scolia': 1,'good':1,1:123}
print a.viewvalues()
print type(a.viewvalues())

9. D.viewitems() -> a set-like object providing a view on D's items

　　返回一个由键和值组成的元祖的类集合对象。

a = {'scolia': 1,'good':1,1:123}
print a.viewitems()
print type(a.viewitems())

　　同样感觉意义不大，原因同上。

6.改

1. x[i]=y

　　和列表中的类似，只是 i 不是索引而是键名，当键名不存在时，就相当于新增键值对了。这里不重复说明了。

2. D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D

　　上面讲过了，不再重复

3. D.update([E, ]**F) -> None.

　　从字典或可迭代对象E和F中，更新元素到字典D中。这里其实也可以归类到增加对象那里去，但字典的增操作和改操作其实很多方法是可以相通的，这里就放到这里了，让这里看起来不会太单薄。

　　这里的**F的写法其实是解决冗余参数的写法，详细我们会在函数中讲。

　　当E .key() 有方法时。

for k in E:
    D[k] = E[k]

　　即当E也是字典时，我们可以将一个字典添加到另一个字典中：

a = {'scolia': 1,'good':1}
b = {'scolia':2, 666:999}
a.update(b)
print a
print b

　　a中的同名键会被b的覆盖掉，且不会影响b本身。

　　当E没有.key()方法时。

for (k, v) in E：
    D[k] = v

　　即E为二元元祖序列，以二元元祖中的第一个元素为键，第二个元素为值，添加到字典中。

a = {'scolia': 1,'good':1,1:0}
b = [('a',123),('b',321),(1,1)]
a.update(b)
print a

　　所谓二元元祖序列，即里面放多个元祖，每个元祖只有两个元素，而其外层为序列，元祖、列表都行。

　　注意：有些同学在学完函数后可能会纠结，**F其实也算是一个字典，那我传进去的字典究竟是传给了谁？

　　　　首先**F是处理冗余参数的，要想有作用，首先参数要超过需要的，而当我们传一个字典或其他对象的时候，是传给了E，当传多个对象的时候，多出来的就到了**F中了，而**F中的对象这里并没有做处理，就相当于多出来的就扔到垃圾桶里去了。

posted @ 2016-05-29 15:08 scolia 阅读(1358) 评论(0) 收藏举报

刷新页面返回顶部

scolia

13.python中的字典

公告