06: 字典、顺序表、列表、hash树 实现原理

算法其他篇

目录:

1.1 python中字典对象实现原理     返回顶部

    注:字典类型是Python中最常用的数据类型之一,它是一个键值对的集合,字典通过键来索引,关联到相对的值,理论上它的查询复杂度是 O(1) 

  1、哈希表 (hash tables)

      1. 哈希表(也叫散列表),根据关键值对(Key-value)而直接进行访问的数据结构。

      2. 它通过把key和value映射到表中一个位置来访问记录,这种查询速度非常快,更新也快。

      3. 而这个映射函数叫做哈希函数,存放值的数组叫做哈希表。 

      4. 通过把每个对象的关键字k作为自变量,通过一个哈希函数h(k),将k映射到下标h(k)处,并将此对象存储在这个位置。

  2、具体操作过程

      1. 数据添加:把key通过哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,
                        将value存储在以该数字为下标的数组空间里。

      2. 数据查询:再次使用哈希函数将key转换为对应的数组下标,并定位到数组的位置获取value。

  3、{“name”:”zhangsan”,”age”:26} 字典如何存储的呢? 

      1. 比如字典{“name”:”zhangsan”,”age”:26},那么他们的字典key为name、age,假如哈希函数h(“name”) = 1、h(“age”)=3,

      2. 那么对应字典的key就会存储在列表对应下标的位置,[None, “zhangsan”, None, 26 ]

  4、解决hash冲突

      

1.2 顺序表     返回顶部

  1、顺序表特点

      1. 线性表的逻辑顺序与物理顺序一致,数据元素之间的关系是以元素在计算机内“物理位置相邻”来体现。

      2. 对顺序表中的所有表项,即可以进行顺序的访问,也可以随机的访问,也就是说,
          既可以从表的第一个表项开始逐个访问表项也可以按照表项的序号(下标)直接的访问。

      3. 无需为表示结点间的逻辑关系而增加额外的存储空间,存储利用率提高。

      4. 可以方便的存储表中的任一结点,存储速度快。

      缺点:

        1)在表中插入新元素或删除无用元素时,为了保持其他元素的相对次序不变,平均需要移动一半元素,运行效率低
        2)由于顺序表要求占用连续的空间,如果预先进性存储分配,则当表长度变化较大时,难以确定合适的存储空间带大小
        3)若按可能达到的最大的长度预先分配表的空间,则容易造成一部分空间长期的限制而得不到充分的利用

  2、链表

      1. 链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。

      2. 链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。

      3. 每个结点包括两个部分:数据域和指针域

      特点:

        1)可以方便的进行扩充。

        2)可以方便的删除和插入。

  3、顺序表的线性存储示意图   

      1. 假设线性表中有n个元素,每个元素占k个存储单元,第一个元素的地址为Loc(a1),则第i个元素的地址Loc(ai):

      2. Loc(ai) = Loc(a1) + (i-1) * k; # 其中Loc(a1)称为基地址。

        

  4、顺序表增删改查原理

# 1、顺序表的初始化
    顺序表的初始化就是把顺序表 初始化为空的顺序表;只需把顺序表的长度length置为0即可;
# 2、求顺序表的长度
    顺序表的长度就是就顺序表中的元素的个数,由于在插入和删除操作中都有对数据表的长度进行修改,所以求表长只需返回length的值即可;
# 3、按序号查找
    查找顺序表中第i个元素的值(按序号查找),如果找到,将将该元素值赋给e。
    查找第i个元素的值时,首先要判断查找的序号是否合法,如果合法,返回第i个元素对应的值。
# 4、插入元素
    在数据表的第i个位置插入元素,在顺序表的第i个位置插入元素e
    首先将顺序表第i个位置的元素依次向后移动一个位置,然后将元素e插入第i个位置,移动元素要从后往前移动元素,
    即:先移动最后一个元素,在移动倒数第二个元素,依次类推;
    插入元素之前要判断插入的位置是否合法,顺序表是否已满,在插入元素之后要将表长L->length++;
# 5、删除操作
    删除表中的第i个元素e,删除数据表中的第i个元素,需要将表中第i个元素之后的元素依次向前移动一位,将前面的元素覆盖掉。
    移动元素时要想将第i+1个元素移动到第i个位置,在将第i+2个元素移动i+1的位置,直到将最后一个元素移动到它的前一个位置。
    进行删除操作之前要判断顺序表是否为空,删除元素之后,将表长L->length--;
# 6、按内容查找
    查找数据元素e在表中的位置,可以从表头开始一直遍历表中元素。
    如果找到与要查找元素e相等的元素,则返回元素在表中的位置,数组下标从0开始。
    则元素在表中对应的位置序号值应为对应数组下标加1,没有找到则返回0。
# 7、头插
    头插,即在表头插入元素e,在表头插入元素,需要将表中的元素依次后移一位,
    然后将要插入的元素e赋给数字的首元素,执行插入操作后将表长L->length++;
    需要注意的是移动元素要从顺序表的最后一个元素开始移动,
    如果从第1个元素开始移动,会使得第1个元素的值覆盖第2个元素的值,然后把第二个元素后移则会使第2个元素的值
    (原来第1个元素值)覆盖第3个元素的值,依次类推,最后出插入元素外,其余元素值均为原顺序表中第一个元素的值。
# 8、头删
    删除顺序表中的第一个元素,只要将顺序表中的元素从第2个开始,依次向前移动1位,覆盖原来顺序表中元素对应位置的前一个值
    在删除元素之前要判断顺序表是否为空,删除顺序表元素之后将顺序表长度L->length--;
# 9、尾插
    在顺序表表尾插入元素e,L->data[L->length] = e;将元素e的值赋给顺序表中最后一个元素的下一个元素;
    尾插操作,需要判断顺序表是否已满,尾插后将顺序表长度L->length++;
# 10、尾删
    删除表尾元素,只需将顺序表的长度减1,类似于出栈操作,栈顶指针top –。
# 11、清空顺序表
    清空顺序表就是将表中的元素删除。删除表中的元素只需将表的长度置为0。
# 12、判断表是否为空
    如果顺序表的长度为0,则顺序表为空,返回1,否则,返回0;
# 13、打印表中元素
    依次打印顺序表中的元素,如果顺序表为空则输出提示。
    
顺序表增删改查原理

1.3 python 列表(list)     返回顶部

  1、python列表

      1. 在CPython中,列表被实现为长度可变的数组。

      2. 列表对象在 C 程序中的数据结构:有一个指针数组用来保存列表元素的指针,和一个可以在列表中放多少元素的标记。

      3. 内存的槽的个数并不是当前列表就有这么多的元素,列表元素的个数和 len(列表)是一样,就是真正的元素的个数。

      4. 但分配的槽的大小,会比元素个数大一点,目的就是为了防止在每次添加元素的时候都去调用分配内存的函数。

  2、C中数组存储方式

      1. 必须牢记:定义并初始化一个数组后,在内存里分配了两个空间,一个用于存放数组的引用变量,一个用于存放数组本身。

      2. 数组引用变量只是一个引用,这个引用变量可以指向任何有效的内存,只有当该引用指向有效内存后,才可通过该数组变量来访问数组元素。

      3. 如果我们希望在程序中访问数组,则只能通过这个数组的引用变量来访问它。

      4. 实际的数组元素被存储在堆(heap)内存中;数组引用变量是一个引用类型的变量,被存储在栈(stack)内存中。

  3、python列表操作时间复杂度

      index() O(1)

      append O(1)

      pop() O(1)

      pop(i) O(n)

      insert(i,item) O(n)

      del operator O(n)

      reverse O(n)

      sort O(nlogn)

  4、列表和元组比较

      1. 列表是动态的,其大小可以改变(重新分配);
      2. 而元组是不可变的,一旦创建就不能修改。
      3. list和tuple在c实现上是很相似的,对于元素数量大的时候,都是一个数组指针,指针指向相应的对象,找不到tuple比list快的理由。
      4. 但对于小对象来说,tuple会有一个对象池,所以小的、重复的使用tuple还有益处的。

  5、tuple使用场景

      1. 实际情况中的确也有不少大小固定的列表结构,例如二维地理坐标等;

      2. 另外tuple也给元素天然地赋予了只读属性;

  6、列表与字典比较

      1. list是有序的,dict是无序的

      2. list通过索引访问,dict使用key访问

      3. list随着数量的正常增长要想查找元素的时间复杂度为O(n), dict不随数量而增长而变化,时间负责都为O(1)

  7、列表和字典应用场景

      1. list一般可作为队列、堆栈使用,而dict一般作为聚合统计或者快速使用特征访问等

      2. list 是记录简单有序数据的,就是一对一的那种,可以理解为一维数组.

      3. dict 是记录复杂无序数据,就是一对多,可以理解为多维数组.

 

posted @ 2019-02-21 09:36  不做大哥好多年  阅读(696)  评论(0编辑  收藏  举报