[Python]collections.defaultdict()模块使用
刷题的时候有看到collections的使用,对这个模块不了解,查阅资料学习记录下。
文章参考:https://blog.csdn.net/yangsong95/article/details/82319675
Python中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。
语法格式:
collections.defaultdict([default_factory[, …]])
class defaultdict(Dict[_KT, _VT], Generic[_KT, _VT]):
default_factory: Callable[[], _VT]
该函数返回一个类似字典的对象。defaultdict是Python内建字典类(dict)的一个子类,它重写了方法_missing_(key),增加了一个可写的实例变量default_factory,实例变量default_factory被missing()方法使用,如果该变量存在,则用以初始化构造器,如果没有,则为None。其它的功能和dict一样。
第一个参数为default_factory属性提供初始值,默认为None;其余参数包括关键字参数(keyword arguments)的用法,和dict构造器用法一样。
-
1.使用list作第一个参数,可以很容易将键-值对序列转换为列表字典。
from collections import defaultdict s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] d=defaultdict(list) for k, v in s: d[k].append(v) a=sorted(d.items()) print d print a ''' defaultdict(<type 'list'>, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]}) [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])] '''
当字典中没有的键第一次出现时,default_factory自动为其返回一个空列表,list.append()会将值添加进新列表;再次遇到相同的键时,list.append()将其它值再添加进该列表。
这种方法比使用dict.setdefault()更为便捷,dict.setdefault()也可以实现相同的功能。
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] d={} for k, v in s: d.setdefault(k,[]).append(v) print d a=sorted(d.items()) print a ''' {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]} [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])] '''
-
2.defaultdict还可以被用来计数,将default_factory设为int即可。
s = 'mississippi' d = defaultdict(int) for k in s: d[k] += 1 print d a=sorted(d.items()) print a ''' defaultdict(<type 'int'>, {'i': 4, 'p': 2, 's': 4, 'm': 1}) [('i', 4), ('m', 1), ('p', 2), ('s', 4)] '''
字符串中的字母第一次出现时,字典中没有该字母,default_factory函数调用int()为其提供一个默认值0,加法操作将计算出每个字母出现的次数。
函数int()是常值函数的一种特例,总是返回0。使用匿名函数(lambda function)可以更快、更灵活的创建常值函数,返回包括0在内的任意常数值。
def constant_factory(value): return lambda: value d = defaultdict(constant_factory('<missing>')) print d d.update(name='John', action='ran') print d print '%(name)s %(action)s to %(object)s' % d ''' defaultdict(<function <lambda> at 0x10c180668>, {}) defaultdict(<function <lambda> at 0x10c180668>, {'action': 'ran', 'name': 'John'}) John ran to <missing> '''
-
3.default_factory设为set时,可以用defaultdict建立集合字典(a dictionary of sets)
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)] d = defaultdict(set) for k, v in s: d[k].add(v) print d a=sorted(d.items()) print a ''' defaultdict(<type 'set'>, {'blue': set([2, 4]), 'red': set([1, 3])}) [('blue', set([2, 4])), ('red', set([1, 3]))] '''