顺序查找

二分查找:在一个已经 完全排序(或者部分排序)的数组中 查找数字或者统计数字的出现次数-

 就是每次缩小一般的范围进行查找或者统计 最后的循环结束的条件就是end-first=1,即二者相邻,若有其中之一为要找的值,则对了,若果都没有就没有了

我的想法是

1 先判断 首、尾 是不是要找的

 1.1是 就最好啦

 1.2 不是 看中间值是不是 

   1.2.1 是就最好啦

   1.2.2不是 比大小 确定下一次要查找的范围 然后在这个范围内在进行重复上述步骤

插值查找:(二分查找升级版)

哈希查找

二叉排序树查找

 

2. 插值查找

二分查找法虽然已经很不错了,但还有可以优化的地方。
有的时候,对半过滤还不够狠,要是每次都排除十分之九的数据岂不是更好?选择这个值就是关键问题,插值的意义就是:以更快的速度进行缩减。

插值的核心就是使用公式:
value = (key - list[low])/(list[high] - list[low])

用这个value来代替二分查找中的1/2。
上面的代码可以直接使用,只需要改一句。

# 插值查找算法
# 时间复杂度O(log(n))

def binary_search(lis, key):
    low = 0
    high = len(lis) - 1
    time = 0
    while low < high:
        time += 1
        # 计算mid值是插值算法的核心代码
        mid = low + int((high - low) * (key - lis[low])/(lis[high] - lis[low]))
        print("mid=%s, low=%s, high=%s" % (mid, low, high))
        if key < lis[mid]:
            high = mid - 1
        elif key > lis[mid]:
            low = mid + 1
        else:
            # 打印查找的次数
            print("times: %s" % time)
            return mid
    print("times: %s" % time)
    return False

if __name__ == '__main__':
    LIST = [1, 5, 7, 8, 22, 54, 99, 123, 200, 222, 444]
    result = binary_search(LIST, 444)
    print(result)

插值算法的总体时间复杂度仍然属于O(log(n))级别的。其优点是,对于表内数据量较大,且关键字分布比较均匀的查找表,使用插值算法的平均性能比二分查找要好得多。反之,对于分布极端不均匀的数据,则不适合使用插值算法。

 

 

八、散列表(哈希表)

 

散列表:所有的元素之间没有任何关系。元素的存储位置,是利用元素的关键字通过某个函数直接计算出来的。这个一一对应的关系函数称为散列函数或Hash函数。
采用散列技术将记录存储在一块连续的存储空间中,称为散列表或哈希表(Hash Table)。关键字对应的存储位置,称为散列地址。

散列表是一种面向查找的存储结构。它最适合求解的问题是查找与给定值相等的记录。但是对于某个关键字能对应很多记录的情况就不适用,比如查找所有的“男”性。也不适合范围查找,比如查找年龄20~30之间的人。排序、最大、最小等也不合适。

因此,散列表通常用于关键字不重复的数据结构。比如python的字典数据类型。

优点:最主要的优点是能在O(1)时间内查找某一元素,查找效率最高!但缺点树需要额外的空间,


附件列表

 

posted on 2017-02-20 20:55  zx0801  阅读(123)  评论(0编辑  收藏  举报