数据结构--BFPRT算法(TOP-K算法)

在一大堆数中求其前k大或前k小的问题

最坏时间复杂度为O(n)

 

1.可以将数组排序,然后取出第k小的数   O(nlogn)

2.维护一个k大小的堆    O(nlogk)

public static class MinHeapComparator implements Comparator<Integer> {
        @Override
        public int compare(Integer o1, Integer o2) {
            return o1 - o2;
        }
    }
    /**
     * 维护一个小根堆,每次都是从小根堆取值
     * @param arrays
     * @param k
     * @return
     */
    public static int[] smallOfKByHeap(int[] arrays, int k) {
        if (k == 0 || arrays == null || arrays.length == 0) return null;

        PriorityQueue<Integer> queue = new PriorityQueue<>( new MinHeapComparator() );

        for(int i = 0; i < arrays.length; i++){
            queue.add( arrays[i] );
        }

        int[] res = new int[k];
        for(int i = 0; i < k; i++){
            res[i] = queue.poll();
        }
        return res;
    }

  

3.一种比较简单的方法:采用荷兰国旗的partition解法,随机(int random = (int)(Math.random() * (right - left + 1)) + left)选取一个数num,进行partition,然后看k在三个区域的哪一部分,在=num区域,则直接返回,若在另外两个区域,则只求解其中的一半即可,依然采取如下的策略  长期期望 O(N)  取决于每次选取的num的位置

public static int smallOfKByPartition(int[] arrays, int k){
        if(k == 0 || arrays == null || arrays.length == 0) return -1;
        int num = smallK( arrays, 0, arrays.length - 1, k - 1 );
        return num;
    }

    public static int smallK(int[] arrays, int left, int right, int k){
        if(left == right) return arrays[left];
        int[] num = partition( arrays, left, right);

        if(num[0] <= k && num[1] >= k){
            return arrays[k];
        } else if(num[0] > k){
            return smallK( arrays, left, num[0] - 1, k);
        } else{
            return smallK( arrays, num[1] + 1, right, k);
        }
    }

    public static int[] partition(int[] arrays, int left, int right){
        int random = (int) (Math.random() * (right - left + 1)) + left;
        swap(arrays, random, right);

        int index = left;
        int small = left - 1, big = right;
        while(index < big){
            if(arrays[index] < arrays[right]){
                swap(arrays, ++small, index++);
            } else if(arrays[index] == arrays[right]){
                index++;
            } else {
                swap(arrays, index, --big);
            }
        }

        swap(arrays, right, big);
        return new int[]{small + 1, big};
    }

    public static void swap(int[] arrays, int i, int j){
        int temp = arrays[i];
        arrays[i] = arrays[j];
        arrays[j] = temp;
    }

 

<num =num >num

4.BFPRT算法:  O(N)    bfprt(array, k)

①将整个数组array[]  5个5个分组,共有n/5组              O(1)

②在组内使用插入排序                          O(N)

③找到每个组的中位数,组成新的数组(长度为n/5) newArray[]       O(N)

④递归调用bfprt(newArray, newArray.length/2)  求出其中位数  num    T(N/5)

⑤然后利用num进行3方法中进行partition,             O(N)            

<num =num >num

⑥若在=num区域时,则返回,否则,选择其中的一半进行后续的partition  T(7N/10)

T(N) = T(N/5) + T(7N/10) + O(N) = O(N)

posted @ 2018-05-03 10:42  SkyeAngel  阅读(2229)  评论(0编辑  收藏  举报