二分法
一、基本概念
二分法又叫对半查找。数学模型表示如下:
(维基百科)
若要求已知函数 f(x) = 0 的根 (x 的解),则:
- 先找出一个区间 [a, b],使得f(a)与f(b)异号。根据介值定理,这个区间内一定包含着方程式的根。
- 求该区间的中点,并找出 f(m) 的值。
- 若 f(m) 与 f(a) 正负号相同则取 [m, b] 为新的区间, 否则取 [a, m].
- 重复第2和第3步至理想精确度为止。
参见[维基百科]你会发现更多有趣的东西。https://zh.wikipedia.org/wiki/%E4%BA%8C%E5%88%86%E6%B3%95
在计算机编程中,我们的思路为:
二分查找的基本思想是:(设R [low...... high]是当前的查找区间)
- 首先确定该区间的中点位置:
- 然后将待查的K值与R[mid].key比较:若相等,则查找成功并返回此位置,否则须确定新的查找区间,继续二分查找,具体方法如下:
①若R[mid].key>K,则由表的有序性可知R[mid..n].keys均大于K,因此若表中存在关键字等于K的结点,则该结点必定是在位置mid左边的子表 R[1..mid-1]中,故新的查找区间是左子表R[1..mid-1]。
②类似地,若R[mid].key<K,则要查找的K必在mid的右子表R[mid+1..n]中,即新的查找区间是右子表R[mid+1..n]。下一次查找是针对新的查找区间进行的。
因此,从初始的查找区间R[1..n]开始,每经过一次与当前查找区间的中点位置上的结点关键字的比较,就可确定查找是否成功,不成功则当前的查找区间就缩小一半。这一过程重复直至找到关键字为K的结点,或者直至当前的查找区间为空(即查找失败)时为止。
5、二分查找判定树
二分查找过程可用二叉树来描述:把当前查找区间的中间位置上的结点作为根,左子表和右子表中的结点分别作为根的左子树和右子树。由此得到的二叉树,称为描述二分查找的判定树(Decision Tree)或比较树(Comparison Tree)。
注意:
判定树的形态只与表结点个数n相关,而与输入实例中R[1..n].keys的取值无关。
【例】具有11个结点的有序表可用下图所示的判定树来表示。
(1)二分查找判定树的组成
①圆结点即树中的内部结点。树中圆结点内的数字表示该结点在有序表中的位置。
②外部结点:圆结点中的所有空指针均用一个虚拟的方形结点来取代,即外部结点。
③树中某结点i与其左(右)孩子连接的左(右)分支上的标记"<"、"("、">"、")"表示:当待查关键字K<R[i].key(K>R[i].key)时,应走左(右)分支到达i的左(右)孩子,将该孩子的关键字进一步和K比较。若相等,则查找过程结束返回,否则继续将K与树中更下一层的结点比较。
(2)二分查找判定树的查找
二分查找就是将给定值K与二分查找判定树的根结点的关键字进行比较。若相等,成功。否则若小于根结点的关键字,到左子树中查找。若大于根结点的关键字,则到右子树中查找。
【例】对于有11个结点的表,若查找的结点是表中第6个结点,则只需进行一次比较;若查找的结点是表中第3或第9个结点,则需进行二次比较;找第1,4,7,10个结点需要比较三次;找到第2,5,8,11个结点需要比较四次。
由此可见,成功的二分查找过程恰好是走了一条从判定树的根到被查结点的路径,经历比较的关键字次数恰为该结点在树中的层数。若查找失败,则其比较过程是经历了一条从判定树根到某个外部结点的路径,所需的关键字比较次数是该路径上内部结点的总数。
【例】待查表的关键字序列为:(05,13,19,21,37,56,64,75,80,88,92),若要查找K=85的记录,所经过的内部结点为6、9、10,最后到达方形结点"9-10",其比较次数为3。
实际上方形结点中"i-i+1"的含意为被查找值K是介于R[i].key和R[i+1].key之间的,即R[i].key<K<R[i+1].key。
(3)二分查找的平均查找长度
设内部结点的总数为n=2h-1,则判定树是深度为h=lg(n+1)的满二叉树(深度h不计外部结点)。树中第k层上的结点个数为2k-1,查找它们所需的比较次数是k。因此在等概率假设下,二分查找成功时的平均查找长度为:
ASLbn≈lg(n+1)-1
二分查找在查找失败时所需比较的关键字个数不超过判定树的深度,在最坏情况下查找成功的比较次数也不超过判定树的深度。即为:
二分查找的最坏性能和平均性能相当接近。
6、二分查找的优点和缺点
虽然二分查找的效率高,但是要将表按关键字排序。而排序本身是一种很费时的运算。既使采用高效率的排序方法也要花费O(nlgn)的时间。
二分查找只适用顺序存储结构。为保持表的有序性,在顺序结构里插入和删除都必须移动大量的结点。因此,二分查找特别适用于那种一经建立就很少改动、而又经常需要查找的线性表。
对那些查找少而又经常需要改动的线性表,可采用链表作存储结构,进行顺序查找。链表上无法实现二分查找。
1 #include <iostream>
2 #include <vector>
3 using namespace std;
4
5 void main()
6 {
7 vector<int>orderArray(10);
8 int randvalue = 0;
9 for (int i = 0;i<orderArray.size();i++)
10 {
11 orderArray[i] =i+10;
12 cout<<orderArray[i]<<"-";
13 }
14
15 int low,high,num;
16 low = 0; high = orderArray.size();
17 int mid = 0;
18 cout<<"请输入要查找的数"<<endl;
19 cin>>num;
20 while(low <=high)
21 {
22 mid = (high+low)/2;
23 if( num < orderArray[mid])
24 {
25 //cout<<orderArray[mid]<<endl;
26 high = mid-1;
27 }
28 if( num > orderArray[mid])
29 {
30 //cout<<orderArray[mid]<<endl;
31 low =mid +1;
32 }
33 if (orderArray[mid] == num)
34 {
35 cout<< " 找到的数值为 num = "<< orderArray[mid]<<endl;
36 break;
37 }
38
39 }
40 if(low >high)
41 {
42 cout<<"无法发现这个数" <<endl;
43 }
44
45
46 }
Java代码实现
//23:10 public void half(int []a, int left, int right,int value){ if(left > right){ System.out.println("没有找到数据!"); return; } int c =(left+right)/2; int mid = a[c]; if(value > mid){ half(a,c,right,value); }else if(value <mid){ half(a,left,c,value); }else{ System.out.print(a[c]); } }