查找－集中查找方式的Pyhon实现

顺序查找

二分查找：在一个已经　完全排序（或者部分排序）的数组中　查找数字或者统计数字的出现次数－

　就是每次缩小一般的范围进行查找或者统计　最后的循环结束的条件就是end-first=1，即二者相邻，若有其中之一为要找的值，则对了，若果都没有就没有了

我的想法是

１　先判断　首、尾　是不是要找的

　１．１是　就最好啦

　１．２　不是　看中间值是不是　

　　　１．２．１　是就最好啦

　　　１．２．２不是　比大小　确定下一次要查找的范围　然后在这个范围内在进行重复上述步骤

插值查找：（二分查找升级版）

哈希查找

二叉排序树查找

2. 插值查找

二分查找法虽然已经很不错了，但还有可以优化的地方。
有的时候，对半过滤还不够狠，要是每次都排除十分之九的数据岂不是更好？选择这个值就是关键问题，插值的意义就是：以更快的速度进行缩减。

插值的核心就是使用公式：
value = (key - list[low])/(list[high] - list[low])

用这个value来代替二分查找中的1/2。
上面的代码可以直接使用，只需要改一句。

# 插值查找算法
# 时间复杂度O(log(n))

def binary_search(lis, key):
    low = 0
    high = len(lis) - 1
    time = 0
    while low < high:
        time += 1
        # 计算mid值是插值算法的核心代码
        mid = low + int((high - low) * (key - lis[low])/(lis[high] - lis[low]))
        print("mid=%s, low=%s, high=%s" % (mid, low, high))
        if key < lis[mid]:
            high = mid - 1
        elif key > lis[mid]:
            low = mid + 1
        else:
            # 打印查找的次数
            print("times: %s" % time)
            return mid
    print("times: %s" % time)
    return False

if __name__ == '__main__':
    LIST = [1, 5, 7, 8, 22, 54, 99, 123, 200, 222, 444]
    result = binary_search(LIST, 444)
    print(result)

插值算法的总体时间复杂度仍然属于O(log(n))级别的。其优点是，对于表内数据量较大，且关键字分布比较均匀的查找表，使用插值算法的平均性能比二分查找要好得多。反之，对于分布极端不均匀的数据，则不适合使用插值算法。

八、散列表（哈希表）

散列表：所有的元素之间没有任何关系。元素的存储位置，是利用元素的关键字通过某个函数直接计算出来的。这个一一对应的关系函数称为散列函数或Hash函数。
采用散列技术将记录存储在一块连续的存储空间中，称为散列表或哈希表（Hash Table）。关键字对应的存储位置，称为散列地址。

散列表是一种面向查找的存储结构。它最适合求解的问题是查找与给定值相等的记录。但是对于某个关键字能对应很多记录的情况就不适用，比如查找所有的“男”性。也不适合范围查找，比如查找年龄20~30之间的人。排序、最大、最小等也不合适。

因此，散列表通常用于关键字不重复的数据结构。比如python的字典数据类型。

优点：最主要的优点是能在O(1)时间内查找某一元素，查找效率最高！但缺点树需要额外的空间，

附件列表

posted on 2017-02-20 20:55 zx0801 阅读(123) 评论(0) 编辑收藏举报