探究STL 优先队列的自定义比较方式与 sort() 等泛型算法的自定义比较方式的区别

前言


  

  最近在刷算法题,常常需要自定义比较函数作为作为函数对象送入 stl 中,遇到了下面的问题:

   泛型算法 sort() 实现从小到大的递增关系是这么写: 

//sort 函数的模板声明
// 可以看出,排序要求容器支持随机访问迭代器,类似于数组的那种下标偏移访问
// 这里 _Compare 是类型, __comp 是实例,调用 sort 需要传入的就是 __comp 实例
template <class _RandomAccessIter, class _Compare>
inline void sort(_RandomAccessIter __first, _RandomAccessIter __last,
                 _Compare __comp)

//利用priority_queue 实现元素间关系为递增(实现最小堆) 的方法如下:
//自定义比较函数,排序时传入函数指针,编译器会进行类型推导做模板特化 
bool cmp (const T& a, const T& b) { return a.x < b.x; } 
//对于自定义结构体,可重载 < 运算符,排序时会默认调用 operator < 
struct T{
    friend bool operator < (const T& a) { 
        return this.x < a.x; 
    } 
};

 

 

  而优先队列里是这么写:

// priority_queue 实现使用的默认比较是 operator< ,是最大堆数据结构,即队列头元素值最大
template <class _Tp,
          class _Sequence __STL_DEPENDENT_DEFAULT_TMPL(vector<_Tp>),
          class _Compare
          __STL_DEPENDENT_DEFAULT_TMPL(less<typename _Sequence::value_type>)
class priority_queue;  // 注意点:如果传入自己的仿函数,那么第二个存储类型也要传入
//利用priority_queue 实现元素间关系为递增(实现最小堆) 的方法如下: //仿函数 struct cmp {   bool operator () (const T& a, const T& b) const { return a.x > b.x; } } //自定义结构体中重载 < struct T { Type_2 x; friend bool operator < (const T&a, const T& b) { return a.x > b.x; } }

 

  同样是实现元素的递增关系即 “前一元素的x分量 < 后一元素的x分量”,为什么前一个是 “a.x < b.x”,而后一个是"a.x > b.x" 呢?

 

分析 sort() 


 

  先拿 sort() 进行分析,排序类的泛型算法很多,它们的 cmp 写法是相似的,这里先看一份冒泡排序实现递增关系如 <1, 2, 3 ..> 的写法,传入的 cmp 将特化为 Compare 实例 comp ,使得容器中的相邻元素按 cmp 中的逻辑进行排序。

#include <iostream> 

template <class BidirectionalIt, class Compare> //双向迭代器
void bubble_sort(BidirectionalIt first, BidirectionalIt last, Compare comp) {
    for (; first != last; --last) 
        for (BidirectionalIt current = first, next = first; ++next != last; ++current) 
            if (!comp(*current, *next)) 
                std::swap(*current, *next); } 
}
bool cmp (int a, int b){
    return a < b;
}    

  一言以蔽之,就是元素将按照 cmp 中定义的逻辑关系进行排列。

  虽然 sort() 是用“快排+堆排+插入”实现的而并非冒泡,但是原理是一样的。

 

分析 priority_queue 


  

  现在我们再来看看优先队列。

  STL优先队列模板:priority_queue<Type, Container, Functional> ,参数分别对应的是“元素类型”、“容器类型”、“比较函数”。

  注意,优先队列不是 STL 的容器,而是由 底层容器 vector/deque 实现的模板类,缺省情况下它利用 MAX-HEAP 实现,而 MAX-HEAP 是 vector 实现的完全二叉树,这样的东西称为适配器 (adapter)。

  在优先队列中默认优先级高的元素先出队列,具体操作是使用函数对象 less<> 重载了 “<”,所以这里优先级的高低是由 “<” 确定的,所以当我们按下面的形式写:

priority_queue<int> pQueue;

  通过操作符 < 知道元素关键字大的优先级高,此时是最大堆。若每次从堆顶取一个元素,最后得到一个序列,那么序列中元素的关系是递减的。

  我们想要让元素的关系是递增该怎么做?

   第一种办法:使用与 less<>作用相反的函数对象 greater<> 。

    ex:如下

priority_queue<int, vector<int>, greater<int> >qi2;

  

  第二种办法:在自定义结构体中重载  < ,通过它实现对自定义数据类型的优先级的定义。

    ex:通过重载 operator < 操作符以比较元素的优先级

struct T{
    DataType key;
    friend bool operator < (const T& a, const T& b) {
        return a.key > b.key;
    }
};

    逻辑是这样:假设 a.key > b.key 为 TRUE ,由于默认是最大堆,此时优先队列会认为 a < b ,即 b 的优先级比 a 高,所以 b会被先出队,这样就实现了关键字小的元素先出队。最后输出的序列是按关键字递增的。

    但此时不能像基本类型这样声明 :priority_queue<T, vector<T>, greater<T> > (注意空格);

    而是只能这样声明:priority_queue<T>

    原因是 greater<T> 没有定义,如果想用这种方法定义,则使用方法3。

    注意,这种办法有缺点,如果有两个模板容器对同一个自定义数据结构需要不同的比较器,那么办法就不如函数对象适用了。

  

  第三种办法:通过函数对象以定义元素的优先级。

  ex:如下

struct T {
    int x;
    T(int xx) : x(xx) {}
};

struct cmp{
    bool operator () (const T& a, const T& b) const
  {
return a.x > b.x; } };

    逻辑和 2 是一样的。这里重载了 () 的目的是使得 cmp 成为像 less<> 一样的函数对象,作为新的比较比较级的规则以 priority_queue 第三个参数的形式传入 priority_queue 中。

   

总结


 

  优先队列的“比较级”概念与”由MAX-HEAP实现“这一特性,使得自定义比较函数中需要这么写: "a.x>b.x" 。

 

延伸阅读


 

  永远让比较函数对相等的值返回false(来自Effective C++)

  C++中的 sort 使用自定义比较函数的具体运行过程是怎样的呢?

  C++自定义比较:仿函数、函数与重载运算符 

 

posted @ 2018-01-28 14:47  bw98  阅读(932)  评论(0编辑  收藏  举报