数据结构与算法-基础
1.数据结构基本术语
数据:程序的操作对象,用于描述客观事物,例如:字符串
数据的特点:1.可以输入到计算机 2.可以被计算机处理
数据元素:组成数据的对象的基本单位,例如:结构体
数据项:一个数据元素由多个数据项组成,例如:结构体中的属性
数据对象:性质相同的数据元素的集合(类似于数组)
struct Teacher { //一种数据结构
char *name; //数据项--名字
char *title; //数据项--职称
int age; //数据项--年龄
};
struct Teacher t1; //数据元素;
struct Teacher tArray[10]; //数据对象;
2.数据结构视角
逻辑结构:是数据对象中的数据元素之间的逻辑关系。逻辑结构分为四种:
- 集合结构
集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。各个数据元素是"平等"的。 - 线性结构
线性结构中的数据元素之间是一对一的关系。
常用的线性结构有:线性表、栈、队列、双队列、数组、串。 - 树形结构
树型结构中的数据元素之间存在一种一对多的层次关系。
常见的树形结构:二叉树、B树、哈夫曼树、红黑树等。 - 图形结构
图形结构的数据元素是多对多的关系。
常见的图形结构:邻近矩阵、邻接表。
物理结构:又称“存储结构”,指的是数据的逻辑结构在计算机的存储形式。
数据存储结构应该正确反映数据元素之间的逻辑关系。如何存储数据元素之间的逻辑关系,是实现物理结构的重点和难点。
数据元素的存储结构形式有2种:
- 顺序存储:把数据元素放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的,缺点:想要插入数据,得要先挪动顺序。
- 链式存储:不需要提前开辟一段连续的内存空间,数据元素放在任意的存储单元里。
数据元素的存储关系并不能直接反映逻辑关系,因此需要用一个指针存放数据元素的地址,通过地址找到相关关联数据元素的位置。
3.数据结构与算法的关系
算法:算法就是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每个指令表示一个或多个操作。
算法与数据结构的关系:数据结构如果脱离算法,或者算法脱离数据结构都是无法进行的。
算法特性:
- 输入输出:输入提供已知条件,输出产生结果。
- 有穷性:执行有限的步骤之后,会自动结束。不会死循环。
- 确定性:相同输入执行后,只有对应唯一的结果,不能有二义性。
- 可行性:每一步都是可行的。每一步都能通过有限次数完成。
算法设计要求:
- 正确性:对任意一个合法的输入经过有限步执行之后算法应给出正确的结果。
- 可读性:算法主要是为了方便程序员的阅读与交流,其次才是便于机器执行。晦涩难懂的程序易隐藏较多错误,难以调试和修改。
- 健壮性:即指算法对于非法输入的抵抗能力,它强调了即使输入了非法数据,算法应能够识别并做出正确处理,而不是产生莫名其妙的输出结果。
- 时间效率高和储存量低:算法的效率通常是指算法的执行时间。对于一个具体的问题,通常有多个算法可以解决,执行时间短的算法其效率就高。所谓存储量,是指算法在执行过程中所需要的最大存储空间。效率与低存储量需求这两者与问题的规模有关。
4.复杂度
时间复杂度:算法的时间复杂度是一个函数,它定性描述该算法的运行时间。这是一个代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述,不包括这个函数的低阶项和首项系数。使用这种方式时,时间复杂度可被称为是渐近的,亦即考察输入值大小趋近无穷时的情况。
大O表示法:用常数1取代运行时间中所有常数,只保留最高阶项,如果在最高阶存在且不等于1,则去除这个项目相乘的常数。
执⾏行行次数 | 函数阶 | 术语 |
---|---|---|
常数阶 | ||
线性阶 | ||
平方阶 | ||
立方阶 | ||
对数阶 | ||
阶 | ||
指数阶 |
举例:
1.常数阶时间复杂度
void testSum1(int n) {
int sum = 0; // 执行1次
sum = (1+n)*n/2; // 执行1次
printf("testSum1:%d\n",sum); // 执行1次
}
一共执行1+1+1=3次,时间复杂度为O(1)
2.线性阶时间复杂度
void add2(int x,int n) {
for(int i = 0; i < n; i++) {
x = x + 1;
}
}
一共执行n次,时间复杂度为O(n)
对于算法的分析:
- 平均时间复杂度:计算所有情况的平均值。
- 最坏时间复杂度:计算最坏的情况下时间复杂度。
空间复杂度:通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记做:,其中,为问题的规模,为语句关于所占存储空间的函数。
除了需要寄存本身所用的指令、常数、变量和输入数据外,还需要一些对数据进行操作的辅助存储空间。
考量空间复杂度是,主要考虑算法执行时所需要的辅助空间。