【LeetCode-堆】数据流中的中位数

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

  • void addNum(int num) - 从数据流中添加一个整数到数据结构中。
  • double findMedian() - 返回目前所有元素的中位数。

示例:

输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]

输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]

题目链接: https://leetcode-cn.com/problems/shu-ju-liu-zhong-de-zhong-wei-shu-lcof/

思路

使用堆来做。我们设置两个堆:minHeap 为小根堆,maxHeap 为大根堆。小根堆存储数据中较大的一半,大根堆存储数据中较小的一半。这样,小根堆和大根堆的堆顶元素就是数据流中间的两个元素。保持 minHeap.size()==maxHeap.size() 或者 minHeap.size()==maxHeap.size()+1,也就是小根堆的大小和大根堆的大小一样大或者小根堆的大小比大根堆大一。

为什么小根堆的大小要和大根堆的大小相等或者比大根堆大一呢? 因为当数据流中的数据为偶数个时,小根堆和大根堆的元素个数是相等的,此时的中位数就是小根堆堆顶和大根堆堆顶的平均值。例如,数据流为 [1,2,3,4],则小根堆元素为 [3,4],堆顶为 3;大根堆元素为 [1,2],堆顶为 2,所以中位数为 (2+3)/2=2.5。当数据流中的元素为奇数个时,小根堆的大小比大根堆的大小大一可以保证小根堆的堆顶元素为中位数。例如,数据流为 [1,2,3,4,5],则小根堆的元素为 [3,4,5],堆顶为 3,大根堆元素为 [1,2],堆顶为 2,中位数为 3。总而言之,这样的堆大小设置仅仅是为了在数据流中数据为奇数个时,我们总是从小根堆里取中位数。其实也可以反过来将大根堆的大小设置为和小根堆相等或者比小根堆的大小大一,代码只有一点点不同。

当小根堆的大小和大根堆的大小相等或者比大根堆大一时的操作如下:
插入元素:

  • 假设插入的元素为 num;
  • 如果 minHeap.size()==maxHeap.size():
    • 因为 minHeap 的尺寸要大于 maxHeap,所以 num 要插入到 minHeap,但我们不是直接将 num 插入到 minHeap 中,而是将 num 插入到 maxHeap 中,然后将 maxHeap 的堆顶元素插入 minHeap 中;
  • 否则,两个堆尺寸不等:
    • 将 num 插入到 maxHeap。同样地,我们不是直接将 num 插入到 maxHeap 中,而是将 num 插入到 minHeap 中,然后将 minHeap 的堆顶元素插入 maxHeap 中;

为什么要这么插入呢?因为我们要保持两个堆的堆顶元素是处于数据中间且距离最近的两个有序元素。

获取中位数:

  • 如果 minHeap.size()!=maxHeap.size(),则中位数就是 minHeap 的堆顶元素;
  • 否则,中位数是两个堆堆顶元素的平均数。

代码如下:
小根堆大小和大根堆大小相等或者比大根堆的大小大一:

class MedianFinder {
public:
    /** initialize your data structure here. */
    MedianFinder() {
        
    }
    
    void addNum(int num) {
        if(minHeap.size()==maxHeap.size()){
            maxHeap.push(num);
            minHeap.push(maxHeap.top());
            maxHeap.pop();
        }else{
            minHeap.push(num);
            maxHeap.push(minHeap.top());
            minHeap.pop();
        }
    }
    
    double findMedian() {
        if(minHeap.size()!=maxHeap.size()) return minHeap.top();
        else return (minHeap.top()+maxHeap.top())/2;
    }
private:
    priority_queue<double, vector<double>, greater<double>> minHeap;    // 小根堆
    priority_queue<double, vector<double>, less<double>> maxHeap;       // 大根堆
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

大根堆大小和小根堆大小相等或者比小根堆的大小大一:

class MedianFinder {
public:
    /** initialize your data structure here. */
    MedianFinder() {
        
    }
    
    void addNum(int num) {
        if(minHeap.size()!=maxHeap.size()){   // 和上面代码不同
            maxHeap.push(num);
            minHeap.push(maxHeap.top());
            maxHeap.pop();
        }else{
            minHeap.push(num);
            maxHeap.push(minHeap.top());
            minHeap.pop();
        }
    }
    
    double findMedian() {
        if(minHeap.size()!=maxHeap.size()) return maxHeap.top();  // 和上面代码不同
        else return (minHeap.top()+maxHeap.top())/2;
    }
private:
    priority_queue<double, vector<double>, greater<double>> minHeap;    // 小根堆
    priority_queue<double, vector<double>, less<double>> maxHeap;       // 大根堆
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

参考

https://leetcode-cn.com/problems/shu-ju-liu-zhong-de-zhong-wei-shu-lcof/solution/mian-shi-ti-41-shu-ju-liu-zhong-de-zhong-wei-shu-y/

posted @ 2020-07-24 22:52  Flix  阅读(189)  评论(0编辑  收藏  举报