基于特定字段分组记录

有一系列字典或实例，并且希望根据特定字段的值（例如日期）对分组（group）的数据进行迭代。
下面有一个子项为字典的序列（list），假如要根据日期（date）进行分组迭代：

rows = [
    {'address': '5412 N CLARK', 'date': '07/01/2012'},
    {'address': '5148 N CLARK', 'date': '07/04/2012'},
    {'address': '5800 E 58TH', 'date': '07/02/2012'},
    {'address': '2122 N CLARK', 'date': '07/03/2012'},
    {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'},
    {'address': '1060 W ADDISON', 'date': '07/02/2012'},
    {'address': '4801 N BROADWAY', 'date': '07/01/2012'},
    {'address': '1039 W GRANVILLE', 'date': '07/04/2012'},
]

from operator import itemgetter
from itertools import groupby

# Sort by the desired field first
rows.sort(key=itemgetter('date'))

# Iterate in groups
for date, items in groupby(rows, key=itemgetter('date')):
    print(date)
    for i in items:
        print('    ', i)

07/01/2012
        {'date': '07/01/2012', 'address': '5412 N CLARK'}
        {'date': '07/01/2012', 'address': '4801 N BROADWAY'}
07/02/2012
        {'date': '07/02/2012', 'address': '5800 E 58TH'}
        {'date': '07/02/2012', 'address': '5645 N RAVENSWOOD'}
        {'date': '07/02/2012', 'address': '1060 W ADDISON'}
07/03/2012
        {'date': '07/03/2012', 'address': '2122 N CLARK'}
07/04/2012
             {'date': '07/04/2012', 'address': '5148 N CLARK'}
             {'date': '07/04/2012', 'address': '1039 W GRANVILLE'}

在根据指定项分组之前，我们需要针对该项进行排序。排序后，相同指定项的为一组。

若只想将相同域的项合并到一个大的数据结构中，如list。可以使用之前博文中提到的defaultdict()。如下代码所示：

from collections import defaultdict
rows_by_date = defaultdict(list)
for row in rows:
    rows_by_date[row['date']].append(row)

>>> for r in rows_by_date['07/01/2012']:
           print(r)
...
...
{'date': '07/01/2012', 'address': '5412 N CLARK'} 
{'date': '07/01/2012', 'address': '4801 N BROADWAY'}

对于这个示例，不需要使用sort方法进行排序，defaultdict对象会根据其键进行归类处理。

posted @ 2019-08-07 10:05 Jeffrey_Yang 阅读(184) 评论(0) 编辑收藏举报

刷新页面返回顶部

Jeffrey_Yang

基于特定字段分组记录

公告