数据结构学习笔记(一:绪论)

数据结构的三要素

1. 数据的逻辑结构

  • 逻辑结构是指数据元素之间的逻辑关系,与数据的存储无关。
  • 数据的逻辑结构分为线性结构非线性结构
    • 线性结构:线性表。结构中的数据元素之间只存在一对一的关系。
    • 非线性结构:
      • 集合:结构中的数据元素之间除“同属一个集合”外,别无其它关系。
      • 树形结构:一般树、二叉树。结构中的数据元素之间存在一对多的关系。
      • 图状结构或网状结构:有向图、无向图。结构中的数据元素之间存在多对多的关系。

2. 数据的存储结构

  • 存储结构是指数据结构在计算机中的表示(又称映像),也称物理结构。它包括数据元素的表示和关系表示。
  • 数据的存储结构使用计算机语言实现的逻辑结构,它依赖于计算机语言。
  • 数据的存储结构主要有顺序存储、链式存储、索引存储和散列存储
    • 顺序存储:把逻辑上相邻的元素存储在物理位置上也相邻的存储单元中,元素之间的逻辑关系以存储单元的邻接关系来体现
      • 优点:可以实现随机存取,每个元素占用最少的存储空间。
      • 缺点:只能使用相邻的一整块存储单元,因此可能产生更多的外部碎片
    • 链式存储:不要求逻辑上相邻的元素在屋里位置上也相邻,借助指示元素存储地址的指针来表示元素之间的逻辑关系
      • 优点:不会出现碎片现象,能充分利用所有存储单元。
      • 缺点:每个元素因存储指针而占用额外的存储空间,且只能实现顺序存取
    • 索引存储:在存储元素信息的同时,还建立附加的索引表(类似目录)。索引表中的每项称为索引项,索引项的一般形式是 (关键字,地址)
      • 优点:检索速度快
      • 缺点:附加的索引表额外占用存储空间。另外,增加和删除数据时也要修改索引表,因而会花费较多的时间(增删数据的时间成本较高)。
    • 散列存储:根据元素的关键字直接计算出该元素的存储地址,又称哈希(hash)存储
      • 优点:检索、增加和删除节点的操作都很快
      • 缺点:若散列函数不好,则可能出现元素存储单元的冲突,而解决冲突会增加时间和空间开销。

3. 数据的运算

  • 施加在数据上的运算包括运算的定义和实现
    • 运算的定义是针对逻辑结构的,指出运算的功能。
    • 运算的实现是针对存储结构的,指出运算的具体操作步骤。

算法的基本概念:

  • 算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作。
  • 算法的五个重要特性:
    1. 有穷性
    2. 确定性
    3. 可行性
    4. 输入
    5. 输出
  • 好算法的目标:
    1. 正确性
    2. 可读性
    3. 健壮性
    4. 效率与低存储量需求

算法效率的度量

1. 时间复杂度

  • 它用来衡量算法随着问题规模增大,算法执行时间增长的快慢。
  • 算法的时间复杂度记为 T(n) = O(ƒ(n)),O是T(n)的数量级,ƒ(n)是基本运算(最深层循环的语句)的频度。
  • 一般考虑在最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。
  • 时间复杂度计算(单个循环体)
    • 直接关注循环体的执行次数,设为k
  • 时间复杂度计算(多个循环体)
    • 两个运算规则:乘法规则,加法规则。
  • 加法规则:T(n) = T1(n) + T2(n) = O(ƒ(n)) + O(g(n)) = O(max(ƒ(n), g(n)))
  • 乘法规则:T(n) = T1(n) × T2(n) = O(ƒ(n)) × O(g(n)) = O(ƒ(n) × g(n))
  • 常见的渐进时间复杂度:O(1)<O(log2n)<O(n)<O(nlog2n)<O(n2)<O(n3)<O(2n)<O(n!)<O(nn)

2. 空间复杂度

  • 它用来衡量算法随着问题规模增大,算法所需空间的快慢。
  • 算法的时间复杂度记为 S(n) = O(g(n))
posted @ 2020-04-02 17:31  枣子今天不吃枣  阅读(249)  评论(0编辑  收藏  举报