骑骡子赶猪  

heapq模块

 

heapq模块中有两个函数--nlargest和nsmallest可以找到列表,元祖,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回

复制代码
import heapq

nums = {1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2}
# nums = [1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2]
# nums = (1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2)
print(heapq.nlargest(3, nums))
print(heapq.nsmallest(3, nums))
复制代码

结果

[42, 41, 37]
[-5, 1, 2]

这两个函数都可以接受一个参数key,从而允许他们工作在更加复杂的数据结构之上

复制代码
import heapq

portfolio = [
    {'name': 'Jan', 'age': 25, 'wages': 100},
    {'name': 'ming', 'age': 10, 'wages': 55},
    {'name': 'san', 'age': 32, 'wages': 321.5},
    {'name': 'si', 'age': 28, 'wages': 222.2},
    {'name': 'wu', 'age': 43, 'wages': 256},
]
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['wages'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['wages'])
print(cheap)
print(expensive)
复制代码

结果

[{'age': 10, 'name': 'ming', 'wages': 55}, {'age': 25, 'name': 'Jan', 'wages': 100}, {'age': 28, 'name': 'si', 'wages': 222.2}]
[{'age': 32, 'name': 'san', 'wages': 321.5}, {'age': 43, 'name': 'wu', 'wages': 256}, {'age': 28, 'name': 'si', 'wages': 222.2}]

如果寻找最大或最小的n个元素,且同数据结构中的元素相比,n很小,那么上述的方法性能不是那么的乐观,这样的情况下我们可以使用堆

import heapq

nums = [1, 4, 5, 7, 36, -3, 65, 33, 26, 28, 2, 4]
heap = list(nums)
heapq.heapify(heap)
print(heap)

结果

[-3, 2, 1, 7, 4, 4, 65, 33, 26, 28, 36, 5]

这些函数首先会在底层将数据转化成列表,且元素会以堆的形式排列

堆最重要的性能就是heap[0]总是最小的那个元素,接下来的元素可依次通过heapq.heappop()方法找到

该方法会将第一个元素(最小的)弹出,然后以第二个元素取而代之(这个操作的复杂度是O(logN),N代表堆的大小)

 

posted on 2019-07-17 13:14  骑骡子赶猪  阅读(142)  评论(0编辑  收藏  举报