算法进阶面试题02——BFPRT算法、找出最大/小的K个数、双向队列、生成窗口最大值数组、最大值减最小值小于或等于num的子数组数量、介绍单调栈结构(找出临近的最大数)

第二课主要介绍第一课余下的BFPRT算法和第二课部分内容

 

1、BFPRT算法详解与应用

找到第K小或者第K大的数。

普通做法:先通过堆排序然后取,是n*logn的代价。

    // O(N*logK)
    public static int[] getMinKNumsByHeap(int[] arr, int k) {
        if (k < 1 || k > arr.length) {
            return arr;
        }
        int[] kHeap = new int[k];//存放第k小的数
        for (int i = 0; i != k; i++) {//把k个数形成大顶堆
            heapInsert(kHeap, arr[i], i);
        }
        //剩余的数,逐个检查是否有小于堆顶的数
        for (int i = k; i != arr.length; i++) {
            if (arr[i] < kHeap[0]) {
                kHeap[0] = arr[i];
                heapify(kHeap, 0, k);
            }
        }
        return kHeap;
    }

    public static void heapInsert(int[] arr, int value, int index) {
        arr[index] = value;
        while (index != 0) {
            int parent = (index - 1) / 2;
            if (arr[parent] < arr[index]) {
                swap(arr, parent, index);
                index = parent;
            } else {
                break;
            }
        }
    }

    public static void heapify(int[] arr, int index, int heapSize) {
        int left = index * 2 + 1;
        int right = index * 2 + 2;
        int largest = index;
        while (left < heapSize) {
            if (arr[left] > arr[index]) {
                largest = left;
            }
            if (right < heapSize && arr[right] > arr[largest]) {
                largest = right;
            }
            if (largest != index) {
                swap(arr, largest, index);
            } else {
                break;
            }
            index = largest;
            left = index * 2 + 1;
            right = index * 2 + 2;
        }
    }

 

基于荷兰国旗问题,可以实现o(N)的代价。

 

 

每次都分小于等于大于区域,再判断是拿大于区域还是小于区域继续划分,等于的话就直接出答案。

 

选划分值是关键。最差情况可能导致o(n²)

因为每个位置都是等概率的,概率累加,数学上的长期期望是o(n)的。

 

BFPRT算法,是严格o(n)的。

流程:

 

 

bfprt获得划分的中位数

 

 

例子:

 

目的:达到第三步如果还超过5个,要继续递归调用划分,直到少于5个找到划分值。

 

为什么选这个值?

复杂度分析:

 

 

按照最差情况最多多少个数比P要小、最多多少个数比P要大。

 

 

 

至少有3N/10个比你大。最多7N/10个比你小。

 

1、逻辑分组

2、组内排序

3、所有数组成一个数组

4、BFPRT调用自己

5、做划分值

6、如果没命中,左右两边只走一侧,左/右部分最多7n/10。

 

应用:在一个数组中,找出最大/小的K个数的问题。

大部分用堆做o(n*logn),最优解是BFPRT。

    // O(N)
    public static int[] getMinKNumsByBFPRT(int[] arr, int k) {
        if (k < 1 || k > arr.length) {
            return arr;
        }
        //获得第K小的数
        int minKth = getMinKthByBFPRT(arr, k);
        int[] res = new int[k];//答案数组
        int index = 0;
        for (int i = 0; i != arr.length; i++) {
            if (arr[i] < minKth) {//把小于K的加入到数组
                res[index++] = arr[i];
            }
        }
        for (; index != res.length; index++) {//不足补K
            res[index] = minKth;
        }
        return res;
    }

    public static int getMinKthByBFPRT(int[] arr, int K) {
        int[] copyArr = copyArray(arr);
        return bfprt(copyArr, 0, copyArr.length - 1, K - 1);
    }

    public static int[] copyArray(int[] arr) {
        int[] res = new int[arr.length];
        for (int i = 0; i != res.length; i++) {
            res[i] = arr[i];
        }
        return res;
    }
    //获得第i小的数
    public static int bfprt(int[] arr, int begin, int end, int i) {
        if (begin == end) {
            return arr[begin];
        }
        //获得中位数的中位数,作为划分值
        int pivot = medianOfMedians(arr, begin, end);
        int[] pivotRange = partition(arr, begin, end, pivot);
        if (i >= pivotRange[0] && i <= pivotRange[1]) {//命中
            return arr[i];
        } else if (i < pivotRange[0]) {
            return bfprt(arr, begin, pivotRange[0] - 1, i);
        } else {
            return bfprt(arr, pivotRange[1] + 1, end, i);
        }
    }
    //获得中位数的中位数
    public static int medianOfMedians(int[] arr, int begin, int end) {
        int num = end - begin + 1;//总数
        int offset = num % 5 == 0 ? 0 : 1;//不够五个自成一组
        int[] mArr = new int[num / 5 + offset];//中位数组成的数组
        for (int i = 0; i < mArr.length; i++) {
            int beginI = begin + i * 5;//开始位置
            int endI = beginI + 4;
            mArr[i] = getMedian(arr, beginI, Math.min(end, endI));
        }
        //复用bfprt,找出数组中第中间小的数,即中位数。
        return bfprt(mArr, 0, mArr.length - 1, mArr.length / 2);
    }

    public static int[] partition(int[] arr, int begin, int end, int pivotValue) {
        int small = begin - 1;
        int cur = begin;
        int big = end + 1;
        while (cur != big) {
            if (arr[cur] < pivotValue) {
                swap(arr, ++small, cur++);
            } else if (arr[cur] > pivotValue) {
                swap(arr, cur, --big);
            } else {
                cur++;
            }
        }
        int[] range = new int[2];
        range[0] = small + 1;//等于区域的最左
        range[1] = big - 1;//最右
        return range;
    }

    public static int getMedian(int[] arr, int begin, int end) {
        insertionSort(arr, begin, end);
        int sum = end + begin;
        System.out.println(end + " " + begin + " " + sum);
        int mid = (sum / 2) + (sum % 2);//取中位数
        System.out.println(mid + "----" + arr[mid]);
        return arr[mid];

    }

    public static void insertionSort(int[] arr, int begin, int end) {
        for (int i = begin + 1; i != end + 1; i++) {
            for (int j = i; j != begin; j--) {
                if (arr[j - 1] > arr[j]) {
                    swap(arr, j - 1, j);
                } else {
                    break;
                }
            }
        }
    }

    public static void swap(int[] arr, int index1, int index2) {
        int tmp = arr[index1];
        arr[index1] = arr[index2];
        arr[index2] = tmp;
    }

    public static void printArray(int[] arr) {
        for (int i = 0; i != arr.length; i++) {
            System.out.print(arr[i] + " ");
        }
        System.out.println();
    }

    public static void main(String[] args) {
        int[] arr = {6, 9, 1, 3, 1, 2, 2, 5, 6, 1, 3, 5, 9, 7, 2, 5, 6, 1, 9};
        // sorted : { 1, 1, 1, 1, 2, 2, 2, 3, 3, 5, 5, 5, 6, 6, 6, 7, 9, 9, 9 }
        printArray(getMinKNumsByHeap(arr, 10));
        printArray(getMinKNumsByBFPRT(arr, 10));

    }

 

 第二课内容

1、介绍窗口及窗口内最大值或最小值的更新结构(单调双向队列)

双端队列结构。

 

 

加数逻辑:进来的数如果比他前面的数要大,那就把前面比他小的全部弹出。

减数逻辑:L向前移动,说明某一下标过期,到队列中检查头部节点是否过期,过期就弹出。

队列中留的数,在L缩的时候,都有可能成为最大值。

 

 

这个情况,3进来干掉了前面进去的1,因为减数是左到右的,1不可能再成为最大值了,所以如果6进来,前面的都可以干掉了。

 

 

总规则:L\R不回退、L不能超过R。

下标必须要,下面的情况以下标大为主。

 

 

应用

1、生成窗口最大值数组

有一个整型数组arr和一个大小为w的窗口从数组的最左边滑到最右边,窗口每次向右边滑一个位置。

例如,数组为[4,3,5,4,3,3,6,7],窗口大小为3时:

 

[4 3 5] 4 3 3 6 7 窗口中最大值为5

4 [3 5 4] 3 3 6 7 窗口中最大值为5

4 3 [5 4 3] 3 6 7 窗口中最大值为5

4 3 5 [4 3 3] 6 7 窗口中最大值为4

4 3 5 4 [3 3 6] 7 窗口中最大值为6

4 3 5 4 3 [3 6 7] 窗口中最大值为7

 

如果数组长度为n,窗口大小为w,则一共产生n-w+1个窗口的最大值。

请实现一个函数,给定一个数组arr,窗口大小w。

返回一个长度为n-w+1的数组res,res[i]表示每一种窗口状态下的最大值。以本题为例,结果应该返回[5,5,5,4,6,7]。

详见代码...

public class Code_01_SlidingWindowMaxArray {
    public static int[] getMaxWindow(int[] arr, int w) {
        if(arr == null || w < 1 || arr.length < w){
            return null;
        }
        
        LinkedList<Integer> qmax = new LinkedList<Integer>();//双向链表,双端队列
        int[] res = new int[arr.length - w + 1];
        int index = 0;
        for (int i = 0; i < arr.length; i++) {
            //当队列不是空且入队列的数大于原队列的最后一个数
            while (!qmax.isEmpty() && arr[qmax.peekLast()] <= arr[i]) {
                qmax.pollLast();
            }
            qmax.addLast(i);
            //每次加一个,缩一个的时候就看看头节点是否过期。
            ///当窗口向右移动,原来在窗口中的最左端数字失效了比如1234,w=3,移动到了4,3-3=0,所以下标为0的就失效,退出队列
            if(qmax.peekFirst() == i - w){
                qmax.pollFirst();
            }
            //当i大于等于窗口大小时才开始计算窗口里的最大值
            if (i >= w - 1) {
                res[index++] = arr[qmax.peekFirst()];
            }
        }
        return res;
    }
        
    public static void main(String[] args) {
        int[] arr={2,3,4,2,6,2,5,1};
        int[] maxWindow = getMaxWindow(arr, 3);
        for (int i = 0; i < maxWindow.length; i++) {
            System.out.print(maxWindow[i]+"-");
        }
    }
}

 

 

2、最大值减去最小值小于或等于num的子数组数量

给定数组arr和整数num,返回有多少个子数组满足如下情况:

max(arr[i..j]) - min(arr[i..j]) <= num

max(arr[i..j])表示子数组arr[i..j]中的最大值,min(arr[i..j])表示子数组arr[i..j]中的最小值。

要求:

如果数组长度为 N,请实现时间复杂度为 O(N)的解法。

子数组的数量。(子数组是连续的)

 

 

暴力方法o(n^3),没必要看了。

    //暴力的方法o(n^3),没必要看了
    public static int getNum1(int[] array,int num) {
        int count = 0;
        for (int start = 0; start != array.length; start++) {
            for (int end = start; end != start; end++) {
                if (isValid(array,start,end,num))
                    count++;
            }
        }
        return count;
    }

    public static boolean isValid(int[] array, int s, int e, int num) {
        int MAX = Integer.MAX_VALUE;
        int MIN = Integer.MIN_VALUE;
        for (int n = s; n != e; n++) {//找出最大最小
            MAX = Math.max(array[n], MAX);
            MIN = Math.min(array[n], MIN);
        }
        return MAX - MIN <= num;
    }
暴力解法

 

 

 

先说几个结论:

1、一个数组L~R达标,内部的子数组一定达标。

缩小范围只可能让MAX变小、MIN变大

 

 

2、L~R不达标,数组往外扩肯定不达标。

 

 

利用这个性质,加上双端队列。

 

使用窗口最大/小值,在扩充下一个后是不达标的位置停下。

假设是0~X,那么就得到了X+1个以0开头的达标数组。(再往后都是不达标的,所以以0开头的全部找出res += x+1)

 

 

接着,L向前移动,R可以继续向前扩,同理到了不能扩的地方就停,L所在的位置就全部计算出。

 

    public static int getNum(int[] arr, int num) {
        if (arr == null || arr.length == 0) {
            return 0;
        }
        //准备最大/小值的更新结构
        LinkedList<Integer> qmin = new LinkedList<Integer>();
        LinkedList<Integer> qmax = new LinkedList<Integer>();
        int L = 0;
        int R = 0;
        int res = 0;
        while (L < arr.length) {
            while (R < arr.length) {//R扩到不能再扩,停
                //最小值结构更新
                while (!qmin.isEmpty() && arr[qmin.peekLast()] >= arr[R]) {
                    qmin.pollLast();
                }
                qmin.addLast(R);
                ////最大值结构更新
                while (!qmax.isEmpty() && arr[qmax.peekLast()] <= arr[R]) {
                    qmax.pollLast();
                }
                qmax.addLast(R);
                //不达标
                if (arr[qmax.getFirst()] - arr[qmin.getFirst()] > num) {
                    break;
                }
                R++;
            }
            //L向前推动,双端队列进行调整
            if (qmin.peekFirst() == L) {
                qmin.pollFirst();
            }
            if (qmax.peekFirst() == L) {
                qmax.pollFirst();
            }
            res += R - L;
            L++;//换一个开头
        }
        return res;
    }

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        int[] arr_test = {1, 2, 3, 4, 5, 6, 7, 8, 9};
        int num_test = 4;
        int res_test;
        res_test = getNum(arr_test, num_test);
        System.out.printf("res = %d", res_test);
    }

 

 

3、介绍单调栈结构

在一个数组中,所有的数左/右边距离最近的比他大的数。

能不能o(n)做到

 

 

弹出的时候生成信息。

让他弹出的是右边比他大的,他下面的是左边最近比他大的。

 

 

如果数组遍历完,就单独处理栈内的信息。单独弹出的右边为null,左边是底下的数。

 

 

特殊情况:

相同的数,压在一起。

 

 

 

相等情况,不会有影响,下标压在一起,共同结算即可。

 

 

 

这个流程为什么对?

因为我们的逻辑是遇到大的就弹出,所以a在碰到c之前,肯定没有遇到比自己大的数,才会等到c出现才弹出的。

 

b肯定在a的左边,为什么b在a的下面?肯定是因为b大于a,如果b和a之间存在数,肯定是小于a的,那并不影响我们的查找左边最近大于a的数的逻辑。也不会存在a<x<b的数,存在的话,就轮不到a挨着b了,会变成a x b。

所以流程证明完毕。

 

 

posted @ 2019-02-14 11:21  kent鹏  阅读(956)  评论(0编辑  收藏  举报