数据结构-王道2017-绪论-1.2 算法和算法评价
1.算法的基本概念
算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令表示一个或多个操作。此外一个算法具有5个重要特性
1) 有穷性 一个算法必须总是(对任何合法的输入值)在执行有穷步之后结束,且每一步都可在有穷时间内完成。
2) 确定性 算法中的每一条指令必须有确切的含义,读者理解时不会产生二义性。即对于相同的输入只能得到相同的输出。
3) 可行性 一个算法是可行的,即算法中描述的操作都是可以通过已经实现的基本运算执行有限次来实现的。
4) 输入 一个算法有一个或多个的输入,这些输入取自于某个特定的对象的集合。
5) 输出 一个算法有一个或多个的输出,这些输出是同输入有着某种特定关系的量。
设计一个好的算法应考虑以下目标:
1)正确性 算法应当能够正确地解决求解问题。
2)可读性 算法应当具有良好的可读性,以助于人们理解
3)健壮性 当输入非法数据时,算法也能适当地做出反应或进行处理,而不会产生莫名其妙的输出结果。
4)效率与低存储量需求: 效率是指算法执行的时间,存储量需求是指算法执行过程中所需要的最大存储空间,这两者都与问题的规模有关。
2.算法效率的度量
使用时间复杂度和空间复杂度来描述:
1)时间复杂度
一个语句的频度是指该语句在算法中被重复执行的次数。算法中所有语句的频度之和记作T(n),它是该算法问题规模n的函数,时间复杂度主要分析T(n)的数量级。算法中的基本运算(最深层循环内的语句)的频度与T(n)同数量级,所以通常采用算法中基本运算的频度f(n)来分析算法的时间复杂度。因此,算法的时间复杂度记为:
T(n) = O(f(n))
取f(n)中随n增长最快的项将其系数置为1作为时间复杂度的度量。
"O"的含义是T(n)的数量级,其严格的数学定义是:T(n) 和 f(n) 是定义在正整数集合上的两个函数,则存在正常数C和n0 , 使得当n>=n0时,都满足0<=T(n)<=C*f(n).
算法的时间复杂度不仅依赖于问题的规模n,也取决于待输入数据的性质(如输入数据的初始状态)。
如: 在数组A[0...n-1]中,查找给定值k的算法大致如下:
(1) i=n-1;
(2) while(i>=0 && (A[i] != k))
(3) i--;
(4) return i;
此算法语句中的语句(3)(基本运算)的频度不仅与问题规模n相关,还与输入实例中A的各元素取值及k的取值有关:
1)如果A中没有与k相等的元素,则语句(3)的频度为f(n) = n;
2) 若A的最后一个元素等于k,则语句(3)的频度f(n)是常数0;
最坏时间复杂度是指在最坏的情况下,算法的时间复杂度。
平均时间复杂度是指所有可能输入实例在等概率出现的情况下,算法的期望运行时间。
最好时间复杂度是指在最好情况下,算法的时间复杂度。
一般总是考虑在最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。
在分析一个程序的复杂性时,有以下两条规则:
a) 加法规则
T(n) = T1(n) + T2(n) = O(f(n)) + O(g(n)) = O(max(f(n),g(n)))
b) 乘法规则
T(n) = T1(n)*T2(n) = O(f(n))*O(g(n)) = O(f(n) * g(n))
常见的渐进复杂度有:
O(1) < O(log2n) < O(n) < O(nlog2n) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)
2)空间复杂度
算法的空间复杂度S(n),定义为该算法所耗费的存储空间,它是问题规模n的函数。渐进空间复杂度也常简称为空间复杂度,记作S(n)=O(g(n)).
一个上机程序除了需要存储空间来存放本身所用指令、常数、变量和输入数据外,也需要一些对数据进行操作的工作单元和存储一些为实现计算所需信息的辅助空间,若输入数据所占空间只取决于问题本身,和算法无关,则只需分析除输入和程序之外的额外空间。
算法原地工作是指算法所需辅助空间是常量,即O(1).