在python中实现数据库下group by功能
在itertools包中,有groupby(iterable[,key])
在对data进行groupby前,先根据与groupby相同的key函数,对data进行排序sorted(data,key)。这是与数据库group by不同的地方。
根据key函数对原迭代器下的各个元素进行分组,将拥有相同函数结果的元素分到一个新的迭代器下,每个新的迭代器以key函数返回结果为标签。由于每次迭代结果会更新,所以最好将结果保存为列表。
例:
>>> from itertools import groupby
>>> def keyfunc(h):
if h>180:
return 'tall'
elif h<160:
return 'short'
else:
return 'middle'
>>> data=[190,180,182,160,155,170,167,178]
>>> data=sorted(data,key=keyfunc)
>>> for k,g in groupby(data,key=keyfunc):
print(k)
print(list(g))
结果:
middle
[180, 160, 170, 167, 178]
short
[155]
tall
[190, 182]
保存到列表的代码:
>>> groups=[]
>>> uniquekeys=[]
>>> for k,g in groupby(data,key=keyfunc):
groups=list(g)
uniquekeys=k
print(groups)
print(uniquekeys)
相关参考:http://blog.sina.com.cn/s/blog_67331d610102vkj6.html