搜索
搜索是在一个项目集合中找到一个特定项目的算法过程。搜索通常的答案是真的或假的,因为该项目是否存在。 搜索的几种常见方法:顺序查找、二分法查找、二叉树查找、哈希查找
二分法查找
二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
时间复杂度
- 最优时间复杂度:O(1)
- 最坏时间复杂度:O(log n)
对于一个大小的数组
n
,性能不像O(n)那样与线性搜索一样,但只有O(log n)。为了说明这一点,对具有1,000,000个元素的数组进行二分查找只需要大约20个步骤来找到您要查找的内容,因为log_2(1,000,000) = 19.9
。对于数十亿个元素的数组,它只需要30个步骤。(2的多少次方等于结果,所以最坏时间复杂度log n)1、递归实现二分查找
# coding:utf-8 def binary_search(alist, left_index, right_index, item): """二分查找 递归""" if left_index > right_index: return None mid_Index = (left_index + right_index) // 2 if alist[mid_Index] == item: return mid_Index elif alist[mid_Index] > item: return binary_search(alist, left_index, mid_Index - 1, item) else: return binary_search(alist, mid_Index + 1, right_index, item) alist = [1, 3, 4, 5, 8, 9, 10] print(binary_search(alist, 0, 6, 8)) # 返回 4 print(binary_search(alist, 0, 6, 2)) # 返回 None
2、非递归实现二分查找
def binary_search2(alist, item): """二分查找 非递归""" n = len(alist) first = 0 last = n - 1 while first <= last: mid = (first + last) >> 1 # 采用移位,等同于mid = (first + last) // 2 if alist[mid] == item: return mid elif alist[mid] > item: last = mid - 1 else: first = mid + 1 return None if __name__ == '__main__': alist = [1, 3, 4, 5, 8, 9,10] print(binary_search2(alist, 3)) print(binary_search2(alist, 19))
二分查找的局限性:
比如说给你有序数组 nums = [1,2,2,2,3],target = 2,此算法返回的索引是 2,没错。但是如果我想得到 target 的左侧边界,即索引 1,或者我想得到 target 的右侧边界,即索引 3,这样的话此算法是无法处理的。
这样的需求很常见。你也许会说,找到一个 target 索引,然后向左或向右线性搜索不行吗?可以,但是不好,因为这样难以保证二分查找对数级的时间复杂度了。
我们后续的算法就来讨论这两种二分查找的算法。
3、寻找左侧边界的二分查找
def left_bound(alist, item): if len(alist) == 0: return None left = 0 right = len(alist) - 1 while left < right: # 终止条件为right=left mid = (left + right) >> 1 if alist[mid] == item: right = mid # 首先找到相等元素,然后依次获取到最左边的相等元素 elif alist[mid] > item: right = mid elif alist[mid] < item: left = mid + 1 return left print(left_bound([1, 2, 2, 2, 3], 2))
4、寻找右侧边界的二分查找
def right_bound(alist, item): if len(alist) == 0: return None left = 0 right = len(alist) - 1 while left <= right: # 终止条件为left < right mid = (left + right) >> 1 if alist[mid] == item: left = mid + 1 # 首先找到相等元素,然后依次获取到最右边的相等元素 elif alist[mid] > item: right = mid - 1 elif alist[mid] < item: left = mid + 1 return right print(right_bound([1, 2, 2, 2, 3], 1))
while left <= right: # 终止条件为left < right
如果剩下[2,3]会进去死循环,因此在if alist[mid] == item:时,left = mid + 1,然后if alist[mid] > item:则right -1 跳出循环