在对线性表的操作中,经常需要查找某一个元素在线性表中的位置。此问题的输入是待查元素x和线性表L,输出为x在L中的位置或者x不在L中的信息。
比较自然的想法是一个一个地扫描L的所有元素,直到找到x为止。这种方法对于有n个元素的线性表在最坏情况下需要n次比较。一般来说,如果没有其他的附加信息,在有n个元素的线性表中查找一个元素在最坏情况下都需要n次比较。
下面我们考虑一种简单的情况。假设该线性表已经排好序了,不妨设它按照主键的递增顺序排列(即由小到大排列)。在这种情况下,我们是否有改进查找效率的可能呢?
如果线性表里只有一个元素,则只要比较这个元素和x就可以确定x是否在线性表中。因此这个问题满足分治法的第一个适用条件;同时我们注意到对于排好序的线性表L有以下性质:
比较x和L中任意一个元素L[i],若x=L[i],则x在L中的位置就是i;如果x<L[i],由于L是递增排序的,因此假如x在L中的话,x必然排在L[i]的前面,所以我们只要在L[i]的前面查找x即可;如果x>L[i],同理我们只要在L[i]的后面查找x即可。无论是在L[i]的前面还是后面查找x,其方法都和在L中查找x一样,只不过是线性表的规模缩小了。这就说明了此问题满足分治法的第二个和第三个适用条件。很显然此问题分解出的子问题相互独立,即在L[i]的前面或后面查找x是独立的子问题,因此满足分治法的第四个适用条件。
于是我们得到利用分治法在有序表中查找元素的算法。
在以上算法中,L为排好序的线性表,x为需要查找的元素,b,a分别为x的位置的上下界,即如果x在L中,则x在L[a..b]中。每次我们用L中间的元素L[m]与x比较,从而确定x的位置范围。然后递归地缩小x的范围,直到找到x。
下面分析该算法的复杂性。设在n个元素的数组中查找x需要的比较次数为T(n),如果每次比较x和L[m]时,总有x<>L[m],即x根本不在L中,则:
T(n)=2+T(n/2),T(1)=1
该方程的解为T(n)=O(logn)。所以在最坏情况下二分查找法的复杂度为O(logn)。
using System;
using System.Collections.Generic;
using System.Text;
namespace QuickSearch
{
internal class SearchUtil
{
internal const int MAX_VALUE = 10000;
public int BinarySearch(int targetNumber, int[] targetArray)
{
int start = 0;
int end = targetArray.Length;
int index = (start + end) / 2;
while(targetArray[index] != targetNumber )
{
if(targetArray[index] >= targetNumber)
{
end = index;
}
else if (targetArray[index] < targetNumber)
{
start = index;
}
index = (start + end) / 2;
}
return index;
}
public int[] Initialization()
{
Random rd = new Random();
int[] result = new int[MAX_VALUE];
for(int i = 0; i < MAX_VALUE; i++)
{
result[i] = i;
}
return result;
}
}
}
测试code:
using NUnit.Framework;
using System;
namespace QuickSearch
{
[TestFixture]
public class QuickSortTest
{
private SearchUtil util;
[SetUp]
public void SetUp()
{
util = new SearchUtil();
}
[Test]
public void TestResults()
{
int[] targetArray = util.Initialization();
Random random = new Random();
int targetNumber = random.Next(0, SearchUtil.MAX_VALUE);
Assert.AreEqual(targetArray[targetNumber], util.BinarySearch(targetNumber, targetArray));
}
}
}