数据结构50：二分查找法(折半查找法)

折半查找，也称二分查找，在某些情况下相比于顺序查找，使用折半查找算法的效率更高。但是该算法的使用的前提是静态查找表中的数据必须是有序的。

例如，在{5,21,13,19,37,75,56,64,88 ,80,92}这个查找表使用折半查找算法查找数据之前，需要首先对该表中的数据按照所查的关键字进行排序：{5,13,19,21,37,56,64,75,80,88,92}。

在折半查找之前对查找表按照所查的关键字进行排序的意思是：若查找表中存储的数据元素含有多个关键字时，使用哪种关键字做折半查找，就需要提前以该关键字对所有数据进行排序。

折半查找算法

对静态查找表{5,13,19,21,37,56,64,75,80,88,92}采用折半查找算法查找关键字为 21 的过程为：

图 1 折半查找的过程（a）

如上图 1 所示，指针 low 和 high 分别指向查找表的第一个关键字和最后一个关键字，指针 mid 指向处于 low 和 high 指针中间位置的关键字。在查找的过程中每次都同 mid 指向的关键字进行比较，由于整个表中的数据是有序的，因此在比较之后就可以知道要查找的关键字的大致位置。

例如在查找关键字 21 时，首先同 56 作比较，由于21 < 56，而且这个查找表是按照升序进行排序的，所以可以判定如果静态查找表中有 21 这个关键字，就一定存在于 low 和 mid 指向的区域中间。

因此，再次遍历时需要更新 high 指针和 mid 指针的位置，令 high 指针移动到 mid 指针的左侧一个位置上，同时令 mid 重新指向 low 指针和 high 指针的中间位置。如图 2 所示：

图 2 折半查找的过程（b）

同样，用 21 同 mid 指针指向的 19 作比较，19 < 21，所以可以判定 21 如果存在，肯定处于 mid 和 high 指向的区域中。所以令 low 指向 mid 右侧一个位置上，同时更新 mid 的位置。

图 3 折半查找的过程（3）

当第三次做判断时，发现 mid 就是关键字 21 ，查找结束。

注意：在做查找的过程中，如果 low 指针和 high 指针的中间位置在计算时位于两个关键字中间，即求得 mid 的位置不是整数，需要统一做取整操作。

折半查找的实现代码：

#include <stdio.h>
#include <stdlib.h>
#define keyType int

typedef struct 
{
    keyType key;　　// 查找表中每个数据元素的值
    // 如果需要，还可以添加其他属性
}ElemType;

typedef struct
{
    ElemType *elem;　　// 存放查找表中数据元素的数组
    int length;　　　　 // 记录查找表中数据的总数量
}SSTable;

// 创建查找表
void Create(SSTable **st, int length)
{
    (*st) = (SSTable*)malloc(sizeof(SSTable));
    (*st)->length = length;
    printf("输入表中的数据元素：\n");
    // 根据查找表中数据元素的总长度，在存储时，从数组下标为 1 的空间开始存储数据
    for (int i=1; i<=length; i++) 
　　 {
        scanf("%d", &((*st)->elem[i].key));
    }
}

//折半查找算法
int Search_Bin(SSTable *ST, keyType key)
{
    int low = 1;　　//初始状态 low 指针指向第一个关键字
    int high = ST->length;　　//high 指向最后一个关键字
    int mid;
    while (low <= high) 
　　{
        mid = (low+high) / 2;　　// int 本身为整形，所以，mid 每次为取整的整数
        if (ST->elem[mid].key == key)　　// 如果 mid 指向的同要查找的相等，返回 mid 所指向的位置
        {
            return mid;
        }
　　　　 else if(ST->elem[mid].key > key)　　// 如果mid指向的关键字较大，则更新 high 指针的位置
        {
            high = mid-1;
        }
        // 反之，则更新 low 指针的位置
        else
　　    {
            low = mid + 1;
       }
    }

    return 0;
}

int main(int argc, const char * argv[]) 
{
    SSTable *st;
    Create(&st, 11);
    getchar();
    printf("请输入查找数据的关键字：\n");
    int key;
    scanf("%d", &key);
    int location = Search_Bin(st, key);
    //如果返回值为 0，则证明查找表中未查到 key 值，
    if (location == 0) 
　　 {
        printf("查找表中无该元素");
    }
　　 else
　　 {
        printf("数据在查找表中的位置为：%d", location);
    }
    return 0;
}

以图 1 的查找表为例，运行结果为：
输入表中的数据元素：
5 13 19 21 37 56 64 75 80 88 92
请输入查找数据的关键字：
21
数据在查找表中的位置为：4

折半查找的性能分析

折半查找的运行过程可以用二叉树来描述，这棵树通常称为“判定树”。例如图 1 中的静态查找表中做折半查找的过程，对应的判定树如图 4：

图 4 折半查找对应的判定树

在判定树中可以看到，如果想在查找表中查找 21 的位置，只需要进行 3 次比较，依次和 56、19、21 进行比较，而比较的次数恰好是该关键字所在判定树中的层次（关键字 21 在判定树中的第 3 层）。

对于具有 n 个结点（查找表中含有 n 个关键字）的判定树，它的层次数至多为：log₂n + 1（如果结果不是整数，则做取整操作，例如： log₂11 +1 = 3 + 1 = 4 ）。

同时，在查找表中各个关键字被查找概率相同的情况下，折半查找的平均查找长度为：ASL = log₂(n+1) – 1。

总结

通过比较折半查找的平均查找长度，同前面介绍的顺序查找相对比，明显折半查找的效率要高。但是折半查找算法只适用于有序表，同时仅限于查找表用顺序存储结构表示。

当查找表使用链式存储结构表示时，折半查找算法无法有效地进行比较操作（排序和查找操作的实现都异常繁琐）。

posted @ 2018-05-21 09:45 程序员进阶笔记阅读(22591) 评论(0) 收藏举报

刷新页面返回顶部

数据结构50：二分查找法(折半查找法)

折半查找算法

折半查找的性能分析

总结

公告