算法复杂度分析(下):最好、最坏、平均、均摊等时间复杂度概述
细化时间复杂度分析
代码千千万,有些代码逻辑会很复杂,所以为了更细化的分析算法的复杂度,再复杂度分析方面引入了4个知识点:
1.最好情况时间复杂度(best case time complexity)。
2.最坏情况时间复杂度(worst case time complexity)。
3.平均情况时间复杂度(average case time complexity)。
4.均摊时间复杂度(amortized time complexity)。
复杂度分析
示例如下(限定条件:0<n且0<x且n和x为整数):
1 public int Function(int n, int x) 2 { 3 int sum = 0; 4 for (int i = 1; i <= n; ++i) 5 { 6 if (i == x) 7 break; 8 sum += i; 9 } 10 return sum; 11 } 12 /* 13 * 作者:Jonins 14 * 出处:http://www.cnblogs.com/jonins/ 15 */
这段代码逻辑非常简单,再此不描述。需要重点分析的是循环这一段代码,这段代码根据x值的不同,时间复杂度也有区别:
1.当x>n时,此代码的时间复杂度是O(n)。
2.当1<=x<=n时,时间复杂度是一个我们不确定的值,取决于x的值。
3.当x=1时,时间复杂度是O(1)。
这段代码在不同情况下,其时间复杂度是不一样的。所以为了描述代码在不同情况下的不同时间复杂度,我们引入了最好、最坏、平均时间复杂度。
最好情况时间复杂度
最好情况时间复杂度,表示在最理想的情况下,执行这段代码的时间复杂度。
上述示例就是当x=1的时候,循环的第一个判断就跳出,这个时候对应的时间复杂度就是最好情况时间复杂度。
最坏情况时间复杂度
最坏情况时间复杂度,表示在最糟糕的情况下,执行这段代码的时间复杂度。
上述示例就是n<x的时候,我们要把整个循环执行一遍,这个时候对应的时间复杂度就是最坏情况时间复杂度。
平均情况时间复杂度
最好和最好情况是极端情况,发生的概率并不大。为了更有效的表示平均情况下的时间复杂度,引入另一个概念:平均情况时间复杂度。
分析上面的示例代码,判断x在循环中出现的位置,有n+1种情况:1<=x<=n 和n<x。
我们将所有情况下代码执行的次数累加起来((1+2+3....+n)+n),然后再除以所有情况数量(n+1),就可以得到需要遍历次数的平均值。
平均情况复杂度为:
$ \frac{((1+2+3...+n)+n)}{(n+1)}=\frac{n(n+3)}{2(n+1)} $
推导过程:
$ \because 1+2+3...+n=n+(n-1)+(n-2)...+1 $
$ \therefore (1+2+3...+n)=\frac{n(1+n)}{2} $
$ \therefore (1+2+3...+n)+n= \frac{n(3+n)}{2} $
大O表示法,会省略系数、低阶、常量,所以平均情况时间复杂度是O(n)。
但是这个平均复杂度没有考虑各自情况的发生概率,这里的n+1个情况,它们的发生概率是不一样的,所以还需要引入各自情况发生的概率再具体分析。
x要么在1~n中,要么不在1~n中,所以它们的概率都是$\frac{1}{2}$。
同时数据在1~n中各个位置的概率都是一样的为$\frac{1}{n}$。根据概率乘法法则,x在1~n中任意位置的概率是$\frac{1}{2n}$。
因此在前面推导过程的基础上,我们把每种情况发生的概率考虑进去,那么平均情况时间复杂度的计算过程变成:
考虑概率的平均情况复杂度为:
$(1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}...+n\frac{1}{2n})+n\frac{1}{2}=\frac{3n+1}{4}$
推导过程:
$\because (1+2+3...+n)=\frac{n(1+n)}{2}$
$\therefore (1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}...+n\frac{1}{2n})=\frac{1}{2n}(1+2+3...+n)=\frac{1}{2n}*\frac{n(1+n)}{2} =\frac{1+n}{4}$
$\therefore (1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}...+n\frac{1}{2n})+n\frac{1}{2}=\frac{1+n}{4} +n\frac{1}{2}=\frac{3n+1}{4}$
这就是概率论中的加权平均值,也叫做期望值,所以平均时间复杂度全称叫:加权平均时间复杂度或者期望时间复杂度。
引入概率之后,平均复杂度变为O($\frac{3n+1}{4}$),忽略系数及常量后,最终得到加权平均时间复杂度为O(n)。
注意:
多数情况下,我们不需要区分最好、最坏、平均情况时间复杂度。只有同一块代码在不同情况下时间复杂度有量级差距,我们才会区分3种情况,为的是更有效的描述代码的时间复杂度。
均摊情况时间复杂度
均摊复杂度是一个更加高级的概念,它是一种特殊的情况,应用的场景也更加特殊和有限。
对应的分析方式称为:摊还分析或平摊分析。
示例如下(限定条件:0<=x<=n且0<=n且n,x为整数):
1 int n; 2 int Function2(int x) 3 { 4 int count = 0; 5 if (n == x) 6 { 7 for (int i = 0; i < n; i++) 8 { 9 count += i; 10 } 11 } 12 else 13 count = x; 14 return count; 15 } 16 /* 作者:Jonins 17 * 出处:http://www.cnblogs.com/jonins/ 18 */
分析上述案例的时间复杂度:
最理想情况下x!=n,只执行一次赋值即可推出,所以最好时间复杂度为O(1)。
最坏的情况下x=n,要执行一次循环累加和的操作,所以最好时间复杂度为O(n)。
平均的情况下,因为限定条件0<=x<=n,x在0~n中存在的位置可以分为n+1种情况(0到n)。
当0<=x<n时,时间复杂度为O(1)。但是x=n的时候是一个例外,它的复杂度是O(n)。
而且这n+1种情况发生的概率都是一样的,为$\frac{1}{n+1}$。所以根据加权平均的计算方法,
平均时间复杂度为:
$ (1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+...+1\tfrac{1}{n+1})+n\tfrac{1}{n+1} = \tfrac{2n}{n+1} $
推导过程:
$(1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+...+1\tfrac{1}{n+1})+n\tfrac{1}{n+1}$
$=n\tfrac{1}{n+1}+n\tfrac{1}{n+1}$
$=\tfrac{2n}{n+1}$
当省略系数及常量后,平均时间复杂度为O(1)。
摊还分析法
分析上述示例的平均复杂度分析并不需要如此复杂,无需引入概率论的知识。
因为通过分析可以看出,上述示例代码复杂度大多数为O(1),极端情况下复杂度才较高为O(n)。同时复杂度遵循一定的规律,一般为1个O(n),和n个O(1)。针对这样一种特殊场景使用更简单的分析方法:摊还分析法。
通过摊还分析法得到的时间复杂度为均摊时间复杂度。
大致思路:每一次O(n)都会跟着n次O(1),所以把耗时多的复杂度均摊到耗时低的复杂度。得到的均摊时间复杂度为O(1)。
应用场景:均摊时间复杂度和摊还分析应用场景较为特殊,对一个数据进行连续操作,大部分情况下时间复杂度都很低,只有个别情况下时间复杂度较高。而这组操作其存在前后连贯的时序关系。
这个时候我们将这一组操作放在一起分析,将高复杂度均摊到其余低复杂度上,所以一般均摊时间复杂度就等于最好情况时间复杂度。
注意:均摊时间复杂度是一种特殊的平均复杂度(特殊应用场景下使用),掌握分析方式即可。