13.python中的字典

  字典其实和之前的元祖和列表功能相似,都是用来储存一系列对象的。也就是一种可变容器,或者是我所比喻的革新派的菜单。

  但也不是完全相同,我在之前曾经将字典称为特殊的'序列',是字典拥有序列的部分特性,但是又不符合序列的定义。

  首先我们来看下字典是如何创建的:

a = {'a':1,'b':2,'c':2}
b = {}
c = dict(a=1)
print a
print b
print c

  我们可以使用{} 或者dict() 来创建一个字典对象。

  但字典里面写的是什么?下面我来分析一下。

  首先,字典是以键值对的形式来储存对象的,即 key:value ,键和值之间用冒号分隔,而每个键值对之间用逗号分隔。

  这个是时候可以联想一下序列的形式,在序列中,对象之间也是用逗号分隔的,但不同的是,序列是使用索引作为key,且索引是提取定义好的,按照一定顺序的。但是字典中,key是自定义的,相当于我们为对象起一个变量名,只不过变量名在字典的key中是以字符串的形式存在的,就像 c 中的创建方式,变量名为 a ,最终得到的键为 'a'。

  那是不是字典的键就只能是字符串类型呢?并不是,我们也可以像序列一样用数字作为键。

a = {666:'scolia',}
print a

 

  当然,为了提高代码可读性,我在只有单个对象的时候还是用了逗号。

  元祖和列表也可以作为键吗?

  答案是:NO!

    虽说几乎所有类型的python对象都能作为键(只要该对象是可哈希的),但是一般还是以数字或者字符串最为常用。

  看到这里,我们可能会想字典无非就是高级一点的列表而已,为什么又不是序列呢?

  因为字典是无序的

  我们看变量 a 中的字典:

a = {'a':1,'b':2,'c':2}

  我们在创建的时候明明是按一定顺序排列的,为什么输出的时候顺序却乱了?

  这正是字典无序性的体现

  首先序列之所以被称为序列:正如其名,有序的、队列式的。我们在序列中逐一放入元素的时候,会自动的按照从左到右进行编号,也就是索引,而每一个索引对应一个对象。而字典却失去了索引的约束,用了自定义的键来取代,当我们在获取对象时也是用键名来获取,只要知道了键名,那么对象在字典中的哪个位置也无所谓了,所以字典是无序的,也就不能称为序列。

  但我们依然可以将其想象为是一种高级的列表,只不过这个列表的索引是自定义的,无序的。

  另外,当字典中的出现了同名的键会怎么办?

a = {'scolia': 1,'scolia':2,'scolia':3}
print a

  就像变量命名一样,前面的都被冲突掉了。

  这时又有同学问:不是说字典是无序的吗?我怎么知道谁在前谁在后?

  我曾经把索引比作是特殊的变量名,只不过普通的变量名不能只是数字,而索引则是通过数字去内存取值。同理,字典里的键也可以看作是变量名,在字典里的元素打包成一个字典之前,先进行了变量的赋值操作,而对同一个变量进行多次赋值相当于切换其在内存的引用,只有最后一个赋值有效,这里也是一样的。在键值对创建的时候,按照我们写时候的顺序先进行赋值操作,然后保存在字典中,保存之后才是无序的。

   那么值相同的时候是否也是同一个对象呢?

a = {'a':300,'b':300}
print id(a['a']),id(a['b'])

  看来是的,和序列中的一样,也是节省内存的优化。

 


 

  接下来我们就可以开始学习字典的内置方法了,首先按老规矩先使用 help(dict) 查看其帮助文档。

Help on class dict in module __builtin__:

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)
 |  
 |  Methods defined here:
 |  
 |  __cmp__(...)
 |      x.__cmp__(y) <==> cmp(x,y)
 |  
 |  __contains__(...)
 |      D.__contains__(k) -> True if D has a key k, else False
 |  
 |  __delitem__(...)
 |      x.__delitem__(y) <==> del x[y]
 |  
 |  __eq__(...)
 |      x.__eq__(y) <==> x==y
 |  
 |  __ge__(...)
 |      x.__ge__(y) <==> x>=y
 |  
 |  __getattribute__(...)
 |      x.__getattribute__('name') <==> x.name
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(...)
 |      x.__gt__(y) <==> x>y
 |  
 |  __init__(...)
 |      x.__init__(...) initializes x; see help(type(x)) for signature
 |  
 |  __iter__(...)
 |      x.__iter__() <==> iter(x)
 |  
 |  __le__(...)
 |      x.__le__(y) <==> x<=y
 |  
 |  __len__(...)
 |      x.__len__() <==> len(x)
 |  
 |  __lt__(...)
 |      x.__lt__(y) <==> x<y
 |  
 |  __ne__(...)
 |      x.__ne__(y) <==> x!=y
 |  
 |  __repr__(...)
 |      x.__repr__() <==> repr(x)
 |  
 |  __setitem__(...)
 |      x.__setitem__(i, y) <==> x[i]=y
 |  
 |  __sizeof__(...)
 |      D.__sizeof__() -> size of D in memory, in bytes
 |  
 |  clear(...)
 |      D.clear() -> None.  Remove all items from D.
 |  
 |  copy(...)
 |      D.copy() -> a shallow copy of D
 |  
 |  fromkeys(...)
 |      dict.fromkeys(S[,v]) -> New dict with keys from S and values equal to v.
 |      v defaults to None.
 |  
 |  get(...)
 |      D.get(k[,d]) -> D[k] if k in D, else d.  d defaults to None.
 |  
 |  has_key(...)
 |      D.has_key(k) -> True if D has a key k, else False
 |  
 |  items(...)
 |      D.items() -> list of D's (key, value) pairs, as 2-tuples
 |  
 |  iteritems(...)
 |      D.iteritems() -> an iterator over the (key, value) items of D
 |  
 |  iterkeys(...)
 |      D.iterkeys() -> an iterator over the keys of D
 |  
 |  itervalues(...)
 |      D.itervalues() -> an iterator over the values of D
 |  
 |  keys(...)
 |      D.keys() -> list of D's keys
 |  
 |  pop(...)
 |      D.pop(k[,d]) -> v, remove specified key and return the corresponding value.
 |      If key is not found, d is returned if given, otherwise KeyError is raised
 |  
 |  popitem(...)
 |      D.popitem() -> (k, v), remove and return some (key, value) pair as a
 |      2-tuple; but raise KeyError if D is empty.
 |  
 |  setdefault(...)
 |      D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D
 |  
 |  update(...)
 |      D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
 |      If E present and has a .keys() method, does:     for k in E: D[k] = E[k]
 |      If E present and lacks .keys() method, does:     for (k, v) in E: D[k] = v
 |      In either case, this is followed by: for k in F: D[k] = F[k]
 |  
 |  values(...)
 |      D.values() -> list of D's values
 |  
 |  viewitems(...)
 |      D.viewitems() -> a set-like object providing a view on D's items
 |  
 |  viewkeys(...)
 |      D.viewkeys() -> a set-like object providing a view on D's keys
 |  
 |  viewvalues(...)
 |      D.viewvalues() -> an object providing a view on D's values
 |  
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  __hash__ = None
 |  
 |  __new__ = <built-in method __new__ of type object>
 |      T.__new__(S, ...) -> a new object with type S, a subtype of T
dict

   按照其功能可分为:

  1.大于、小于、等于等比较运算符

  2.成员判断

  3.内置函数相关的(参考这里

  4.增删改查相关操作


1.比较运算符

  因为字典不是序列了,所以就不能像序列一样按照索引逐个打擂台了。

  不过大小的比较规则还是一样的,只是上场的顺序未知而已。

  那到底比较的时候顺序是怎么样的,看下面的例子。

a = {'a':1,'b':2,'c':3}
for x in a:
    print x

 

  我们使用for循环来看看比较时的顺序,可以看出,顺序是无可预估的,虽然这里只有三个键值对,貌似有一定的规律,但是一旦里面的对象多起来,就得不出规律了,而且不可能每次比较的时候都要自己看一下里面是怎么比的,那样实在太累,所以我们得出一个结论:少用字典间的比较,要比较用序列去

  另外这里补充一点:当我们使用for循环时,我们得到的是键名,如果我们要取到值怎么办?可以像下面这样写:

a = {'a':1,'b':2,'c':3}
for x in a:
    print a[x]

 

  当然还有其他写法,看完内置方法后自己总结吧。


2.成员判断

1. in 

   在序列中判断里面有没有某个元素时使用的是 in ,但细心的同学会发现,在帮助文档中并没有出现 in ,是不是in不能用了呢?

  看下面这个例子:

a = {'a':1,'b':2, 3:30}
b = 2
print b in a
print 2 in a
print 'b' in a
print 3 in a

 

 

   还可以使用,但是这里 in 只能判断字典里是否有哪个,而不是键对应的值。

 

2. D.has_key(k) -> True if D has a key k, else False 

   和 in 一样,判断里面是否有某个键,返回布尔值。

a = {'a':1,'b':2, 3:30}
print a.has_key('b')
print a.has_key(3)

 

 

 

3. D.__contains__(k) -> True if D has a key k, else False 

  判断是否有某个键,和上面的一样,就不多说明了。

 

4.判断字典里面是否有某个对象。

  字典中并没有内置的方法能直接判断,但是我们可以自己写一个。

a = {'a':1,'b':2, 3:30}
b = 30
c = a.values()  #返回一个由字典的值组成的列表
print c     #同样我们无法预估字典里的顺序
print b in c

 

 

   我们转了一个弯,这就要考验思维的灵活性了。


3.增

1. x.__setitem__(i, y) <==> x[i]=y 

  这个和列表中的不同,列表的这个写法是修改元素,如果给的索引不存在是会报错的。但在字典中,这个方法除了可以用来修改元素之外,如果给定的键不存在,则会在字典中创建这个键值对。

a = {'a':1,'b':2, 3:30}
a['scolia'] = 'good'
print a

 

2.  dict.fromkeys(S[,v]) -> New dict with keys from S and values equal to v. v defaults to None. 

   这个方法用于创建新的字典对象,我这里将其归类到这里。

  其中,S 为一个键的序列,v为值,将为S所指定的所有键设置同一个值,默认为None。

a = dict.fromkeys(('scolia'),123)
b = dict.fromkeys(('scolia',))
print a
print b

 

  注意S的写法,这就是为什么在元祖只有一个元素的时候一定要加一个逗号,否则解释器会将其当作传参,将字符串传进去,而字符串也是一个序列,所以没一个字符都被当做一个键,就造成了a的输出了。将S写成一个列表就不会有这样的错误,但元祖消耗的资源少,具体选择看个人。

a = dict.fromkeys(['scolia'],123)
print a

 

a = {'scolia': 1,'good':1,1:0}
print a.fromkeys(('k'),123)
print a

  这里很特殊,创建的对象并没有添加到原字典中,而是所为一个返回值。

 

3. D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D 

  这是一个集查询、修改、增加键值对的方法。

a = dict.fromkeys(['scolia'],123)
print a.setdefault('s',123)
print a

 

  这里解释这个方法的细节:首先k是必须的参数,如果只给k一个参数,则d默认为None,也可以指定d的值。

a = dict.fromkeys(['scolia'],123)
print a.setdefault('scolia')
print a.setdefault('s')
print a

 

  其执行顺序为:

  1.先用给定的k看看里面有没有对应的键,有就返回这个键的值。

  2.如果没有k这个键,则创建这个键,然后用d作为其值,如果d没给就默认为None(空对象)。


4.删

1. del x[y] 

  用del关键字删除对象,在列表中讲过,只不过y从索引变成了键名。这里不再重复。

2.  D.clear() -> None. Remove all items from D. 

  删除整个字典里的元素,返回值为None。

a ={'scolia':123}
print a.clear()
print a

 

  不需要传参,但要注意就算清空了字典里的所以元素,最后得到的还是一个空字典,而不是空对象None。

3. D.pop(k[,d]) -> v, remove specified key and return the corresponding value. 

  删除指定的键值对,并返回相应的值。如果没找到键返回d,若连d都没给,则触发KeyError错误。

a ={'scolia':123,123:321}
print a.pop(123)
print a.pop(666,'没找到')
print a.pop(999)

4. D.popitem() -> (k, v), remove and return some (key, value) pair as a 2-tuple; but raise KeyError if D is empty. 

  删除字典中的第一个元素,并将其按一个元祖返回,如果字典为空则触发KeyError错误

a ={'scolia':123,123:321,555:777}
print a
print a.popitem()
print a

 

  但还是那句话,字典中元素的顺序是未知的,谁知道第一个是什么,所以多配合迭代循环使用,逐个删除掉。

 


5.查

1. D.keys() -> list of D's keys 

  返回一个由键组成的列表

a ={'scolia':123,123:321,555:777}
print a.keys()

 

2. D.values() -> list of D's values 

  返回一个由值组成的列表

a ={'scolia':123,123:321,555:777}
print a.values()

 

3. D.items() -> list of D's (key, value) pairs, as 2-tuples 

  返回一个由键值组成的元祖的列表。

a ={'scolia':123,123:321,555:777}
print a.items()

 

4. D.iterkeys() -> an iterator over the keys of D 

  返回一个包含所有键的迭代对象

a ={'scolia':123,123:321,555:777}
b = a.iterkeys()
for x in b:
    print x

 

5. D.itervalues() -> an iterator over the values of D 

  返回一个包含所有值的迭代对象,原理同上,不再详细说明。

6. D.iteritems() -> an iterator over the (key, value) items of D 

  返回一个包含键值对元祖的迭代对象,同理。另外注意下元祖的迭代循环技巧。

7. D.viewkeys() -> a set-like object providing a view on D's keys 

  返回一个键的类似集合的对象。集合的作用是去除重复,但字典对于键的重复已经有相应处理,感觉意义不大。

a = {'scolia': 1,'scolia':2,1:123}
print a.viewkeys()
print type(a.viewkeys())

 

8.  D.viewvalues() -> an object providing a view on D's values 

  返回一个值的视图对象,注意不是集合对象,没有去重作用。

a = {'scolia': 1,'good':1,1:123}
print a.viewvalues()
print type(a.viewvalues())

 

9.  D.viewitems() -> a set-like object providing a view on D's items 

  返回一个由键和值组成的元祖的类集合对象。

a = {'scolia': 1,'good':1,1:123}
print a.viewitems()
print type(a.viewitems())

 

  同样感觉意义不大,原因同上。

 


 

6.改

1. x[i]=y 

  和列表中的类似,只是 i 不是索引而是键名,当键名不存在时,就相当于新增键值对了。这里不重复说明了。

2. D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D 

  上面讲过了,不再重复

3. D.update([E, ]**F) -> None. 

  从字典或可迭代对象E和F中,更新元素到字典D中。这里其实也可以归类到增加对象那里去,但字典的增操作和改操作其实很多方法是可以相通的,这里就放到这里了,让这里看起来不会太单薄。

  这里的**F的写法其实是解决冗余参数的写法,详细我们会在函数中讲。

  当E .key() 有方法时。

for k in E:
    D[k] = E[k]

  即当E也是字典时,我们可以将一个字典添加到另一个字典中:

a = {'scolia': 1,'good':1}
b = {'scolia':2, 666:999}
a.update(b)
print a
print b

 

  a中的同名键会被b的覆盖掉,且不会影响b本身

  当E没有.key()方法时。

for (k, v) in E:
    D[k] = v

 

  即E为二元元祖序列,以二元元祖中的第一个元素为键,第二个元素为值,添加到字典中。

a = {'scolia': 1,'good':1,1:0}
b = [('a',123),('b',321),(1,1)]
a.update(b)
print a

 

  所谓二元元祖序列,即里面放多个元祖,每个元祖只有两个元素,而其外层为序列,元祖、列表都行。

  注意:有些同学在学完函数后可能会纠结,**F其实也算是一个字典,那我传进去的字典究竟是传给了谁?

    首先**F是处理冗余参数的,要想有作用,首先参数要超过需要的,而当我们传一个字典或其他对象的时候,是传给了E,当传多个对象的时候,多出来的就到了**F中了,而**F中的对象这里并没有做处理,就相当于多出来的就扔到垃圾桶里去了。

 

posted @ 2016-05-29 15:08  scolia  阅读(1325)  评论(0编辑  收藏  举报