defaultdict创建字典
因为字典的hash性所以key一定是唯一的
- 在创建字典的时候可以想象它的可以做到的事情是,unique后对数据分类或统计
- 但是字典中有多少唯一的值并不确定
- 此时引入defaultdict可以很好的达到取值和统计
比如:
常见的案例是对文本中的字母进行数量统计:
from collections import defaultdict text="aaddbbedr" count_text=defaultdict(int) for i in text: count_text[i] +=1 print(count_text)#方便显示过程
#结果如下:
defaultdict(<class 'int'>, {'a': 1}) defaultdict(<class 'int'>, {'a': 2}) defaultdict(<class 'int'>, {'a': 2, 'd': 1}) defaultdict(<class 'int'>, {'a': 2, 'd': 2}) defaultdict(<class 'int'>, {'a': 2, 'd': 2, 'b': 1}) defaultdict(<class 'int'>, {'a': 2, 'd': 2, 'b': 2}) defaultdict(<class 'int'>, {'a': 2, 'd': 2, 'b': 2, 'e': 1}) defaultdict(<class 'int'>, {'a': 2, 'd': 3, 'b': 2, 'e': 1}) defaultdict(<class 'int'>, {'a': 2, 'd': 3, 'b': 2, 'e': 1, 'r': 1})
第二个是数据分析中常用的对应引入字典key和value:
to_get_dict=["abc","time",9,["a","b"]] index=["apple","dog","age","fee"] to_dict=defaultdict(tuple) for x,y in zip(to_get_dict,index): to_dict[x]=y print(to_dict)
#结果如下:
defaultdict(<class 'tuple'>, {'abc': 'apple'}) defaultdict(<class 'tuple'>, {'abc': 'apple', 'time': 'dog'}) defaultdict(<class 'tuple'>, {'abc': 'apple', 'time': 'dog', 9: 'age'})