随笔 - 88  文章 - 0  评论 - 12  阅读 - 84003

大话数据结构 - 算法时间复杂度

2.9.1 算法时间复杂度定义

    在进行算法分析时,语句总的执行次数 T(n)  是关于问题规模 n 的函数,进而分析 T(n) 随 n 的变化情况并确定 T(n) 的数量级。

    算法的时间复杂度,也就是算法的时间度量,记作:T(n) = O(f(n))。

    它表示随问题规模 n 的增大,算法时间的增长率和 f(n) 的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。

    其中 f(n) 是问题规模 n 的某个函数。

  这样用大写 O() 来体现算法时间复杂度的记法,我们称之为大O记法。

  一般情况下,随着 n 的增大,T(n) 增长最慢的算法为最优算法。

  显然,由此算法时间复杂度的定义可知,我们的三个求和算法的时间复杂度分别为 O(1) ,O(n) ,O(n²) 。

  我们分别给它们取了非官方的名称,O(1) 叫常数阶,O(n) 叫线性阶,O(n²) 叫平方阶,当然,还有其他的一些阶,我们之后会介绍。


 2.9.2 推导大O阶方法

  那么如何分析一个算法的时间复杂度呢?即如何推导大O阶呢?我们给出了下面的推导方法。

复制代码
    推导大O阶:

    1. 用常数1取代运行时间中的所有加法常数。

    2. 在修改后的运行次数函数中,只保留最高阶项。

    3. 如果最高阶项存在且不是1,则去除与这个项相乘的常数。

    得到的结果就是大O阶。
复制代码

  哈,仿佛是得到了游戏攻略一样,我们好像已经得到了一个推导算法时间复杂度的万能公式。

  可事实上,分析一个算法的时间复杂度,没有这么简单,我们还需要多看几个例子。


 2.9.3 常数阶

  首先顺序结构的时间复杂度。下面这个算法,也就是刚才的第二种算法,为什么时间复杂度不是 O(3),而是 O(1)。

int sum = 0,n = 100;  /*执行一次*/
sum = (1+n)*n/2;   /*执行一次*/
printf("%d", sum);  /*执行一次*/

  这个算法的运行次数函数是 f(n)=3。根据我们推导大O阶的方法,第一步就是把常数项3改为1。在保留最高阶项时发现,它根本没有最高阶项,所以这个算法的时间复杂度为O(1)。
      另外,我们试想一下,如果这个算法当中的语句 sum = (1 + n) * n / 2 有10句,即:

复制代码
int sum=0,n=100;    /* 执行1次 */
sum = (1+n)*n/2;    /* 执行第1次 */
sum = (1+n)*n/2;    /* 执行第2次 */
sum = (1+n)*n/2;    /* 执行第3次 */
sum = (1+n)*n/2;    /* 执行第4次 */
sum = (1+n)*n/2;    /* 执行第5次 */
sum = (1+n)*n/2;    /* 执行第6次 */
sum = (1+n)*n/2;    /* 执行第7次 */
sum = (1+n)*n/2;    /* 执行第8次 */
sum = (1+n)*n/2;    /* 执行第9次 */
sum = (1+n)*n/2;    /* 执行第10次 */
printf("%d",sum);   /* 执行1次 */
复制代码

  事实上无论n为多少,上面的两段代码就是3次和12次执行的差异,这种与问题的大小无关(n的多少),执行时间恒定的算法,我们称之为具有O(1)的时间复杂度,又叫常数阶。
  注意,不管这个常数是多少,我们都记作O(1),而不能是O(3)、O(12)等其他任何数字。这是初学者常常犯的错误。
  对于分支结构而言,无论是真,还是假,执行的次数都是恒定的,不会随着n的变大而发生变化,所以单纯的分支结构(不包含在循环结构中),其时间复杂度也是O(1)


2.9.4 线性阶
  循环结构就会复杂很多。要确定某个算法的阶次,我们常常需要确定某个特定语句或某个语句集运行的次数。因此,我们要分析算法的复杂度,关键就是要分析循环结构的运行情况。
  下面这段代码,它的循环的时间复杂度为O(n)。因为循环体中的代码须要执行n次。

int i,n=100,sum=0;
for( i=0; i < n; i++)
{
    sum=sum+i;
}

上面这段代码,它的循环的时间复杂度为O(n),因为循环体中的代码需要执行n次。其实,线性阶就是一个简单的for循环,条件在i<n,因而时间复杂度为O(n)。


2.9.5 对数阶
        那么下面的这段代码,时间复杂度又是多少呢?

int i=1,n=100;
while( i<n )
{
    i=i*2;
}

  由于每次count乘以2之后,就距离n更近了一分。也就是说,有多少个2相乘后大于n,则会退出循环。由2x=n得到x=log2n。所以这个循环的时间复杂度为O(logn)。


2.9.6 平方阶
  n等于100,也就是说外层循环每执行一次, 内层循环就执行100次 那总共程序想要从这两个循环出来,需要执行100*100次, 也就是n的平方。 所以这段代码的时间复杂度为0(n^2)。那如果有三个这样的嵌套循环呢? 没错,那就是n^3。所以我们很容易总结得出,循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

  例一:下面的例子是一个循环嵌套,它的内循环刚才2.9.4中分析过,内循环时间复杂度为O(n)。

int i,j;
for(i=0; i<n; i++)
{
    for(j=0; j<n; j++)
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}

  而对于外层的循环,不过是内部这个时间复杂度为O(n)的语句,再循环n次。所以这段代码的时间复杂度为O(n²)。

  例二:如果外循环的循环次数改为了m,时间复杂度则变为O(m×n)。

int i,j;
for(i=0; i<m; i++)
{
    for(j=0; j<n; j++)
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}

  例三:那么下面这个循环嵌套,它的时间复杂度是多少呢?

int i,j;
for(i=0; i<n; i++)
{
    for(j=i; j<n; j++)   /*  注意j=i而不是0  */
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}

  由于

  当i=0时,内循环执行了n次,

  当i=1时,执行了n-1次,

  …………

  当i=n-1时,执行了1次。

  n + (n-1) + (n-2) + …… +1 = n(n+1)/2 = n²/2 + n/2

  用我们推导大O阶的方法:

  第一条,没有加法常数,不考虑;

  第二条,只保留最高阶项,因此保留n²/2;

  第三条,去除这个项相乘的常数,也就是去除1/2,

  最终这段代码的时间复杂度为O(n²)。

  例四:对于方法调用的时间复杂度又如何分析?

复制代码
int i,j;
for(i=0; i<n; i++)
{
    function(i);
}
 
void function(int count)
{
    printf( count );
}
复制代码

  函数体是打印这个参数。其实这很好理解,function函数的时间复杂度是O(1)。所以整体的时间复杂度是O(n)。

  例五:假如 function 是下面这样的:

复制代码
int i,j;
for(i=0; i<n; i++)
{
    function(i);
}
 
void function(int count)
{
    int j;
    for(j=count; j<n; j++)
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}
复制代码

  其实这和刚刚的例子是一样的,只是把嵌套内循环放到了函数中,所以最终的时间复杂度还是为O(n²)。

  例六:下面这段相对复杂的语句:

复制代码
n++;                /* 执行次数为1 */
function(n);        /* 执行次数为n */
int i,j;
for(i=0; i<n; i++)  /* 执行次数为n² */
{
    function(i);
}
for(i=0; i<n; i++)  /* 执行次数为n(n+1)/2 */
{
    for(j=i; j<n; j++)
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}
复制代码

  它的执行次数 f(n) = 1 + n + n² + n(n+1)/2 = 3n²/2 + 3n/2 + 1

  根据推导大0阶的方法,最终这段代码的时间复杂度也是0(n²)。


 

2.10 常见的时间复杂度

  常用时间复杂度所耗费时间从小到大依次为:

  O(1) < O(logn) < O(n) < O(nlogn) < O(n²) < O(n³) < O(2n) < O(n!) < O(nn)

  我们前面谈到了 O(1) 常数阶、O(logn)对数阶、O(n)线性阶、O(n²)平方阶等,至于 O(nlogn) 我们将会在今后的课程中介绍,而像 O(n³),过大的n都会使得结果变得不现实。同样指数阶 O(2^n) 和阶乘阶 O(n!) 等除非是很小的n值,否则哪怕n只是100,都是噩梦般的运行时间。所以这种不切实际的算法时间复杂度,一般我们都不去讨论它。


 

2.11 最坏情况和平均情况

  我们查找一个有 n 个随机数字数组中的某个数字,最好的情况是第一个数字就是,那么算法的时间复杂度为 O(1),但也有可能这个数字就在最后一个位置上待着,那么时间的复杂的就是 O(n),这是最坏的一种情况了。

  最坏情况运行时间是一种保证,那就是运行时间将不会再坏了。在应用中,这是一种最重要的需求,通常,除非特别指定,我们提到的运行时间都是最坏情况的运行时间。

  平均运行时间是所以情况中最有意义的,因为它是期望的运行时间。也就是说,我们运行一段代码的时,是希望看到评价运行时间的。可现实中,平均运行时间很难通过分析得到,一般都是通过运行一定数量的实验数据后估算出来的。

  对算法的分析,一种方法是计算所有情况的平均值,这种时间复杂度的计算方法称为平均时间复杂度。另一种方法是计算最坏情况下的时间复杂度,这种方法称为最坏时间复杂度。一般在没有特殊说明的情况下,都是指最坏时间复杂度。

 

posted on   法哈席基  阅读(374)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示