二分搜索以及其扩展形式
欢迎探讨,如有错误敬请指正
如需转载,请注明出处 http://www.cnblogs.com/nullzx/
二分搜索使用的前提是数组必须有序,在本文中,我们用lo(low)表示查找范围的起始下标,hi(hight)表示查找范围的结束下标,mid表示lo和hi的中间位置。
1. 一般情况二分搜索
/*普通二分搜索,如果找到key,返回任意一个和key相等的元素下标,否则返回-1*/ public static int find(int[] a, int key){ int lo = 0, hi = a.length - 1; while(lo <= hi){ int mid = (lo + hi) / 2; if(a[mid] > key){ hi = mid - 1; }else if(a[mid] < key){ lo = mid + 1; }else{ return mid; } } return -1; }
现在我们来看正常的二分搜索,我们来讨论一下如果没有找到这这个元素时,lo和hi下标的元素值和key的大小关系。如果没有找到key,最后一个查找的位置一定是lo == hi的位置,下标lo之前元素的一定比key小,下标hi之后元素的一定比key大。如果当前位置(即lo和hi的下标)比key大,hi减小1;如果当前位置比key小,lo增加1。总之lo会比hi大1,结束循环。如果没有找到key,lo和hi两者之一有可能越界,hi越界时 hi为-1,lo越界时lo为a.length。在没有越界的情况下,循环结束以后,a[hi] < key,a[lo] > key。所以, 如果没有找到这这个元素,a[hi]是小于key中最接近key的值,a[lo]是大于key中最接近key的值。
2. 最小下标二分搜索
问题:如果不存在key,返回-1, 如果存在key,返回和key相等的元素中的最小的下标。
思路:如果a[mid] == key 则用lastFind记录下mid,然后在[lo, mid-1]中继续继续查找,如果在这个新范围内还能找到和key相等的元素下标,则替换lastFind,然后更新lo和hi,继续迭代上述过程,直到lo > hi;如果没有找到,lastFind就是最小下标 。
/*如果不存在目标元素,返回-1, 如果存在目标元素,返回和目标元素相等中下标最小的*/ public static int findWithMinIndex(int[] a, int key){ int lo = 0, hi = a.length - 1; int lastFind = -1; while(lo <= hi){ int mid = (lo + hi)/2; if(a[mid] > key){ hi = mid - 1; }else if(a[mid] < key){ lo = mid + 1; }else{ lastFind = mid; hi = mid - 1; } } return lastFind; } /*上述问题的第二种实现方法 public static int findWithMinIndex(int[] a, int target){ int lo = 0, hi = a.length - 1; while(lo <= hi){ int mid = (lo + hi)/2; if(a[mid] >= target){ hi = mid - 1; }else{ lo = mid + 1; } } if(lo < a.length && a[lo] == target){ return lo; }else{ return -1; } } */
同理,我们可以解决大于等于key的元素个数的问题。
3. 小于key的元素个数
整个数组中的元素可以分为两种,大于等于key的和小于key的。如果a[mid] >= key下一个查找的范围是[lo, mid-1],如果a[mid] < key下一个查找的范围是[mid+1, hi], 直到lo > hi 才退出循环。最后一个查找的位置一定是lo == hi的位置,lo下标之前的一定小于key,hi下标之后的一定大于等于key。如果当前位置(即lo和hi的下标)的元素值大于等于key,hi减小1;如果当前位置小于key小,lo增加1。所以当循环结束时,lo之前下标的元素都是小于key的,而这些元素的个数等于lo。
/*返回数组元素 <key 的元素个数*/ public static int findLessCnt(int[] a, int key){ int lo = 0, hi = a.length - 1; while(lo <= hi){ int mid = (lo + hi)/2; if(a[mid] >= key){ hi = mid - 1; }else{ lo = mid + 1; } } return lo; }
同理,我们可以解决大于key的元素个数的问题。
4. 小于等于key的元素个数
整个数组中的元素可以分为两种,大于key的和小于等于key的。如果a[mid] > key下一个查找的范围是[lo, mid-1],如果a[mid] <= key下一个查找的范围是[mid+1, hi],直到lo > hi 才退出循环。最后一个查找的位置一定是lo == hi的位置,lo下标之前的一定小于等于key,hi下标之后的一定大于key。如果当前位置(即lo和hi的下标)的元素值大于key,hi减小1;如果当前位置小于等于key小,lo增加1。所以当循环结束时,lo之前下标的元素都是小于等于key的,而这些元素的个数等于lo。
/*返回 数组元素中 <=key 的元素个数*/ public static int findLessEqualCnt(int[] a, int key){ int lo = 0, hi = a.length - 1; while(lo <= hi){ int mid = (lo + hi) / 2; if(a[mid] > key){ hi = mid - 1; }else{ lo = mid + 1; } } return lo; }
同理,我们可以解决大于等于key的元素个数的问题。