选择算法

基于快排的选择算法:就是从数组中随机选一个数，比这个数小的放左边，大的放右边，如果放左边的数的个数等于k-1，说明现在选的这个数就是第k大的数。如果放左边的数的个数大于k个，则递归寻找左边的数组中的第k小的元素，找出的这个数，就是原来数组中的第k大元素。如果放左边的数的个数小于k个，则在右边的数组当中找第k-p-1小的元素（p为左边数组的大小）。
基于堆的选择算法：维护一个k个元素的最大堆，首先从数组当中取出k个数填入这个堆。然后每次从数组中取出一个元素，和堆顶进行比较。如果比堆顶元素大，则忽略。如果比堆顶元素小，则替换掉堆顶元素，并做一次下滤。

#include <iostream>
#include <ctime>
#include <cstdio>
#include <cstdlib>
#include <algorithm>
#include <algorithm>
#include "windows.h"
using namespace std;
bool cmp(int a,int b){
    return a<b;
}
int k;//第k小
const int num  = 10000;//数组大小
int testData[num],testData1[num],testData2[num];
//快排方法
int search1(int start, int end , int order){
    if (start >= end-1) return testData1[start];
    
    int x  = start;
    int tmp = rand()%(end-start)+start;
    swap(testData1[x],testData1[tmp]);
    tmp = testData1[x];
    
    int y = end-1;
    while(x < y){
        while (x < y && testData1[y] >= tmp){
            y--;
        }
        if (x < y){
            testData1[x] = testData1[y];
            x++;
        }
        while (x < y && testData1[x] <= tmp){
            x++;
        }
        if (x < y){
            testData1[y] = testData1[x];
            y--;
        }
    }
    testData1[x] = tmp;
    
    if (x-start == order-1) return testData1[x];
    if (x-start >= order){
        return search1(start, x , order);
    }
    else{
        return search1(x+1 , end , order-(x-start)-1 );
    }
}
//堆方法
int search2(int start, int end , int order){
    make_heap(&testData2[0],&testData2[order],cmp);
    for (int i = order ; i <  num; i++){
        if (testData2[i] < testData2[0]){
            pop_heap(&testData2[0],&testData2[order],cmp);
            testData2[order-1] = testData2[i];
            push_heap(&testData2[0],&testData2[order],cmp);
        }
    }
    return testData2[0];
}
int main(){
    srand(time(0));
    cout << "k  time1   time2"<<endl;
    for ( k = 1 ; k < 1000 ;k+=20){
        int cc = 1000;
        int time1 = 0,time2 = 0;
        
        while(cc--){
            for (int i = 0 ; i < num ; i++){
                testData[i] = rand()%40000;
                testData1[i] = testData[i];
                testData2[i] = testData[i];
            }
            
            int start_time=GetTickCount();
            search1(0,num,k);//快排
            int end_time=GetTickCount();
            time1 += end_time-start_time;   
            start_time=GetTickCount();
            search2(0,num,k);//最小堆
            end_time=GetTickCount();
            time2 += end_time-start_time;           
        }
        cout << k << "  " << time1 << " "<<time2 << endl;
    }
    return 0;
}
}

实验结果：

PS：基于快排的算法不稳定，最坏情况是O(n^2)的。在算法导论第9.3节有一个最坏情况为O(n)的选择算法。

posted @ 2015-08-15 15:38 Shiyu_Huang 阅读(243) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能[OpenRL][知乎][GitHub][Linkedin]如果你对人工智能前沿感兴趣，欢迎联系并加入我们！

选择算法

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能
[OpenRL][知乎][GitHub][Linkedin]
如果你对人工智能前沿感兴趣，欢迎联系并加入我们！