二分查找

参考链接：https://www.bilibili.com/video/BV1Ft41157zW

一，算法思想

　　假设我们要找的值在区间 [l, r] 中，我们根据区间的中间位置的值 a[m] 与目标值的关系，更新 l 和 r 的取值，从而对区间 [l, r] 进行二分来缩小区间。而当区间缩小到足够小时，即可确定目标值。

二，代码（以查询大于等于k且下标最小的数字的下标为例）

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#define N 100
int a[N], k;
int bsearch(int l, int r) // 循环
{
    while (l + 1 < r)
    {
        int m = l + (r - l) / 2;
        if (a[m] < k)
            l = m;
        else
            r = m;
    }
    return r;
}
int find(int l, int r) // 递归
{
    if (l + 1 >= r)
        return r;

    int m = l + (r - l) / 2;
    if (a[m] < k)
        return find(m, r);
    else
        return find(l, m);
}
int main(void)
{
    int n;
    while (scanf("%d%d", &n, &k) != EOF)
    {
        for (int i = 0; i < n; i++)
            scanf("%d", &a[i]);
        printf("%d\n", bsearch(-1, n));
        printf("%d\n", find(-1, n));
    }
    system("pause");
    return 0;
}
/*
7 1
1 2 3 4 5 6 7
7 7
1 2 3 4 5 6 7
7 4
1 2 3 4 5 6 7
7 4
1 2 4 4 4 6 7
7 4
1 2 3 5 6 7 8
7 0
1 2 3 4 5 6 7
7 8
1 2 3 4 5 6 7

*/

View Code

三，代码解析（以查询大于等于k且下标最小的数字的下标为例）

1， l 与 r 的指向

　　① 算法进行时

　　　　l：小于 k 的值的坐标

　　　　r：大于等于 k 的值的下标

　　② 算法结束时

　　　　l：小于 k 且下标最大的值的下标

　　　　r：大于等于 k 且下标最小的值的下标

2，为什么算法结束后， l 与 r 的指向会是这样？

　　因为

　　　　① 算法进行时，l 必须满足小于 k 的坐标；r 必须满足大于等于 k 的值的坐标。

　　　　② 算法终止的条件是 l + 1 >= r，即 l 与 r 位置刚好相邻。

　　所以，只有一种情况，算法才有可能终止：

　　　　l：小于 k 且下标最大的值的下标；r：大于等于 k 且下标最小的值的下标。此时，l 和 r 相邻

3，注意点

　　① 数组中未必有 k

　　② 注意边界

　　　　　　当数组为 [1, 3, 5, 6]，目标值为 0 时，预期的答案是 0，但如果 l 的初值为 0 的话，最终的答案只能为 1。

　　　　因为 l 无法再小了，所以 r 最小也之能到 1。

　　　　　　当数组为 [1, 3, 5, 6]，目标值为 7 时，预期的答案是 4，但如果 r 的初值为 3 的话，最终的答案只能为 1。

　　　　因为 r 无法再大了，所以 r 最大也之能到 3。

　　　　而且，但 l 和 r 的初始值为 -1 和 n 时，该下标对应的值 (虽然没有对应的值) 是不会被动用的

　　　　　　因为，但 l == -1 时，且要找的值下溢出，此时动的只有 r，且当 r 移动到 0 时，算法结束，没有动用过 -1 对应的值。

　　　　　　因为，但 r == n 时，且要找的值上溢出，此时动的只有 l，且当 l 移动到 n-1 时，算法结束，没有动用过 n 对应的值。

　　③ 区间 <==> 结束条件

　　　　如果区间决定了，则结束条件也相应的确定了。反之亦然。（见例题⑤）　　　　

4，递归说明

　　在搜索阶段，通过判断区间的中间位置的值 a[m] 与目标值的关系，更新 l 和 r 的取值，从而对区间 [l, r] 进行二分来缩小区间。

　　在回溯阶段，不断将搜索的结果 return 下去。

四，百花

　　根据三种结束条件，二分法可以有三种写法。（其中，l + 1 < r 最简单）

　　　　① l + 1 < r；② l < r；③ l <= r;

　　根据实现的方法不同，每种二分法可以有两种写法

　　　　① 循环；② 递归

　　根据 l 和 r 的判断条件，每种二分可以用来求解两种问题

　　　　① 求小于等于 k 且下标最大的数字的下标；

　　　　② 求大于等于 k 且下标最小的数字的下标；

下面给出求解大于等于 k 且下标最小的数字的下标的问题的代码，另外一个问题可以自己尝试着自己推导一下。

① l + 1 < r && 求大于等于 k 且下标最小的数字的下标 && 包含循环和递归的写法

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#define N 100
int a[N], k;
int bsearch(int l, int r) // 循环
{
    while (l + 1 < r)
    {
        int m = l + (r - l) / 2;
        if (a[m] < k)
            l = m;
        else
            r = m;
    }
    return r;
}
int find(int l, int r) // 递归
{
    if (l + 1 >= r)
        return r;

    int m = l + (r - l) / 2;
    if (a[m] < k)
        return find(m, r);
    else
        return find(l, m);
}
int main(void)
{
    int n;
    while (scanf("%d%d", &n, &k) != EOF)
    {
        for (int i = 0; i < n; i++)
            scanf("%d", &a[i]);
        printf("%d\n", bsearch(-1, n));
        printf("%d\n", find(-1, n));
    }
    system("pause");
    return 0;
}
/*
7 1
1 2 3 4 5 6 7
7 7
1 2 3 4 5 6 7
7 4
1 2 3 4 5 6 7
7 4
1 2 4 4 4 6 7
7 4
1 2 3 5 6 7 8
7 0
1 2 3 4 5 6 7
7 8
1 2 3 4 5 6 7

*/

View Code

② l < r && 求大于等于 k 且下标最小的数字的下标 && 包含循环和递归的写法

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define N 100
int a[N], k;
int find(int l, int r) // 递归
{
    if (l >= r)
        return r;

    int m = l + (r - l) / 2;
    if (a[m] < k)
        return find(m + 1, r);
    else
        return find(l, m);
}
int bsearch(int l, int r) // 循环
{
    while (l < r)
    {
        int m = l + (r - l) / 2;
        if (a[m] < k)
            l = m + 1;
        else
            r = m;
    }
    return r;
}
int main(void)
{
    int n;
    while (scanf("%d%d", &n, &k) != EOF)
    {
        for (int i = 0; i < n; i++)
            scanf("%d", &a[i]);
        printf("%d\n", bsearch(0, n));
        printf("%d\n", find(0, n));
    }
    system("pause");
    return 0;
}
/*
7 1
1 2 3 4 5 6 7
7 7
1 2 3 4 5 6 7
7 4
1 2 3 4 5 6 7
7 4
1 2 4 4 4 6 7
7 4
1 2 3 5 6 7 8
7 0
1 2 3 4 5 6 7
7 8
1 2 3 4 5 6 7

*/

View Code

③ l <= r && 求大于等于 k 且下标最小的数字的下标 && 包含循环和递归的写法

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define N 100
int a[N], k;
int find(int l, int r) // 递归
{
    if (l > r)
        return l;

    int m = l + (r - l) / 2;
    if (a[m] < k)
        return find(m + 1, r);
    else
        return find(l, m - 1);
}
int bsearch(int l, int r) // 循环
{
    while (l <= r)
    {
        int m = l + (r - l) / 2;
        if (a[m] < k)
            l = m + 1;
        else
            r = m - 1;
    }
    return l;
}
int main(void)
{
    int n;
    while (scanf("%d%d", &n, &k) != EOF)
    {
        for (int i = 0; i < n; i++)
            scanf("%d", &a[i]);
        printf("%d\n", bsearch(0, n - 1));
        printf("%d\n", find(0, n - 1));
    }
    system("pause");
    return 0;
}
/*
7 1
1 2 3 4 5 6 7
7 7
1 2 3 4 5 6 7
7 4
1 2 3 4 5 6 7
7 4
1 2 4 4 4 6 7
7 4
1 2 3 5 6 7 8
7 0
1 2 3 4 5 6 7
7 8
1 2 3 4 5 6 7

*/

View Code

五，例题

① 链接：https://leetcode-cn.com/problems/search-insert-position/

求解思路：

　　求插入的位置就是要求 > k 的值的下标；求目标值就是求 == k 的值的下标。综上就是求大于等于 k 且下标最小的数字的下标。

class Solution {
public:
    int k;
    int find(vector<int>& a, int l, int r) // 递归
    {
        if (l+1 >= r)
            return r;

        int m = l + (r - l) / 2;
        if (a[m] < k)
            return find(a, m, r);
        else
            return find(a, l, m);
    }
    int bsearch(vector<int>& a, int l, int r) // 循环
    {
        while (l + 1 < r)
        {
            int m = l + (r - l) / 2;
            if (a[m] < k)
                l = m;
            else
                r = m;
        }
        return r;
    }

    int searchInsert(vector<int>& nums, int target) {
        k = target;
        return find(nums, -1, nums.size());
        return bsearch(nums, -1, nums.size());
    }
};

View Code

② 链接：https://leetcode-cn.com/problems/find-first-and-last-position-of-element-in-sorted-array/

求解思路：

　　主要是没有找到的判断条件：

　　　　数组为空 return -1；

　　　　找到的值超出边界，return -1；(要是 u 或者 d == -1 最后就返回 -1 了，所以这里可以不用判断)

　　　　找到的值不等于边界值，return -1；

class Solution {
public:
    int k;
    int findU(vector<int>& a, int l, int r)
    {
        if (l + 1 >= r)
            return r;

        int m = l + (r - l) / 2;
        if (a[m] < k)
            return findU(a, m, r);
        else
            return findU(a, l, m);
    }
    int findD(vector<int>& a, int l, int r)
    {
        if (l + 1 >= r)
            return l;

        int m = l + (r - l) / 2;
        if (a[m] <= k)
            return findD(a, m, r);
        else
            return findD(a, l, m);
    }

    vector<int> searchRange(vector<int>& nums, int target) {
        if(nums.empty())
            return {-1, -1};

        k = target;
        int u = findU(nums, -1, nums.size());
        int d = findD(nums, -1, nums.size());
        if(u == nums.size() || d == nums.size())
            return {-1, -1};
        if(nums[u] != target || nums[d] != target)
            return {-1, -1};
        return {u, d};
    }
};

View Code

③ 链接：https://leetcode-cn.com/problems/find-minimum-in-rotated-sorted-array/

求解思路：

　　以最小值为分界线，左边的值大于 nums.back()，右边的值小于 nums.back()，最小值在 >= nums.back() 且下标最小的数字的下标。

　　所以，可以设 k 为 nums.back()，令 l 指向大于 nums.back() 的值的下标，令 r 指向小于等于 nums.back() 的值的下标。

　　于是，算法结束后 r 就指向最小值的下标。

class Solution {
public:
    int find(vector<int>& nums, int l, int r)
    {
        if(l + 1 >= r)
            return r;
        int m = l + (r - l) / 2;
        if(nums[m] > nums.back())
            return find(nums, m, r);
        else
            return find(nums, l, m);
    }
    int findMin(vector<int>& nums) {
        return nums[find(nums, -1, nums.size())];
    }
};

View Code

④ 链接：https://leetcode-cn.com/problems/search-in-rotated-sorted-array/

求解思路：

　　在上一题的基础上，先求出最小值的下标，在进行目标值与 nums.back() 的大小比较。

　　若大于 nums.back()，则对区间 [0, m-1] 进行二分；

　　若小于 nums.back()，则对区间 [m, n-1] 进行二分。

class Solution {
public:

    int findM(vector<int>& nums, int l, int r)
    {
        if(l + 1 >= r)
            return r;
        int m = l + (r - l) / 2;
        if(nums[m] > nums.back())
            return findM(nums, m, r);
        else
            return findM(nums, l, m);
    }

    int k;
    int find(vector<int>& nums, int l, int r)
    {
        if(l + 1 >= r)
            return r;

        int m = l + (r - l) / 2;
        if(nums[m] < k)
            return find(nums, m, r);
        else
            return find(nums, l, m);
    }

    int search(vector<int>& nums, int target) {
        if(nums.empty())
            return -1;

        k = target;
        int m = findM(nums, -1, nums.size());

        int l, r;
        if(target <= nums.back())
            l = m - 1, r = nums.size();
        else
            l = -1, r = m;
        int x = find(nums, l, r);
        if(nums.size() == x || nums[x] != target)
            return -1;
        return x;
    }
};

View Code

⑤ 链接：https://leetcode-cn.com/problems/find-peak-element/

求解思路：

　　① 若 a[m] < a[m+1]，则说明 m+1 ~ n-1 的区间必存在峰值。

　　② 若 a[m] > a[m+1]，则说明 0 ~ m 的区间必存在峰值。

　　证 ①：

　　　　若 m+2 ~ n-1 的值皆小于 a[m+1]，则 a[m+1] 为峰值；

　　　　若 m+2 ~ n-1 的值皆大于 a[m+1]，则分为两种情况：

　　　　　　若 m+2 ~ n-1 的值是单调递增的，则 a[n-1] 为峰值；

　　　　　　若 m+2 ~ n-1 的值是不具有单调性的，则其中某个值必为峰值；

　　　　综上，① 得证。

　　注意点：

　　　　这一题的结束条件不能用 l + 1 >= r，因为：

　　　　　　定性分析：因为当最后 l 和 r 指向最后剩下的两个时，并不一定是 l 或者是 r 的指向是峰值，它们的较大值才是峰值。所以 l 和 r 必须指向同一个值才能判定哪个值是峰值，即结束条件只能是 l >= r

　　　　　　定量分析：因为判断条件后执行的语句只能是 l = m + 1 或者 r = m，所以结束条件只能是 l >= r

　　　　所以说，区间决定结束条件。

class Solution {
public:
    int find(vector<int>& nums, int l, int r)
    {
        if (l >= r)
            return r;
        int m = l + (r - l) / 2;
        if (nums[m] < nums[m + 1])
            return find(nums, m + 1, r);
        else
            return find(nums, l, m);
    }
    int findPeakElement(vector<int>& nums) {
        return find(nums, 0, nums.size() - 1);
    }
};

View Code

⑥ 链接：https://leetcode-cn.com/problems/h-index-ii/

求解思路：

　　问题概述：设 h 满足：在升序序列中 h 个数大于 h，求 h 的最大值。

　　因为需要在数组取 h 个数，所以 h ~ [0, n]，

　　所以，可以用二分在 [0, n] 内查找：

　　　　设 m 为 h

　　　　　　如果 nums[ nums.size() - m ] >= m，则说明 nums.size() - m ~ nums.size() - 1 之间 m 个都是大于等于 m，

　　　　　　　　所以此时 h 一定在区间 [m, n ] 之间;

　　　　　　如果 nums[ nums.size() - m ] < m，则说明大于等于 m 的个数小于 m，

　　　　　　　　所以此时 h 一定在区间 [0, m-1 ] 之间;

　　　注意点:

　　　　　　① 还是区间决定结束条件，所以结束条件还是只能用 l >= r

　　　　　　② 因为 h ~ [0, n]，所以取中间值要用 l + r + 1 >> 1

class Solution {
public:
    int find(vector<int>& nums, int l, int r)
    {
        if(l>=r)
            return r;
        int m = r + l + 1 >> 1;
        if(nums[nums.size()-m]>=m)
            return find(nums, m,r);
        else
            return find(nums, l,m-1);
    }
    
    int hIndex(vector<int>& citations) {
        return find(citations, 0, citations.size());
    }
};

View Code

========== ========== ======== ======= ====== ====== ==== === == =

问刘十九　　白居易(唐)

绿蚁新醅酒，红泥小火炉。

晚来天欲雪，能饮一杯无？

posted @ 2020-01-03 10:51 叫我妖道阅读(220) 评论(0) 编辑收藏举报

刷新页面返回顶部

叫我妖道

代码这东西，能动手就别哔哔

二分查找