算法的概念
算法(Algorithm)是解决特定问题的过程的描述,算法不仅存在于计算机领域,生活的方方面面都存在算法,比如炒菜的食谱,建筑的工程设计等等都叫做算法。
算法的五大特征:
»有穷性
»确切性
»输入项
»输出项
»可行性
有穷性是指算法的步骤必须是有限的,具体到代码层面就是必须是可以结束的。
确切性是指没一个步骤必须是明确的,不能是模棱两可不可执行的。
算法可以有0个或多个输入,但必须有输出,没有输出的算法毫无意义。
可行性是指算法每一步必须是在现阶段条件下可以实现的。
算法的时间复杂度
解决一个问题有很多种算法,但各种算法所消耗的时间和空间差异不尽相同,我们要选择效率更高,消耗资源更少的算法,而在计算机中,Cpu是稀缺资源往往比内存更加宝贵,所以一般我们只关注算法对Cpu的占用,也就是算法的时间复杂度。
时间频度
一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。
时间复杂度
前面提到的时间频度T(n)中,n称为问题的规模,当n不断变化时,时间频度T(n)也会不断变化。但有时我们想知道它变化时呈现什么规律,为此我们引入时间复杂度的概念。一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数,记作T(n)=O(f(n)),它称为算法的渐进时间复杂度,简称时间复杂度。
大O表示法
像前面用O( )来体现算法时间复杂度的记法,我们称之为大O表示法。
算法复杂度可以从最理想情况、平均情况和最坏情况三个角度来评估,由于平均情况大多和最坏情况持平,而且评估最坏情况也可以避免后顾之忧,因此一般情况下,我们设计算法时都要直接估算最坏情况的复杂度。
大O表示法O(f(n)中的f(n)的值可以为1、n、logn、n²等,因此我们可以将O(1)、O(n)、O(logn)、O(n²)分别可以称为常数阶、线性阶、对数阶和平方阶,那么如何推导出f(n)的值呢?我们接着来看推导大O阶的方法。
推导大O阶
推导大O阶,我们可以按照如下的规则来进行推导,得到的结果就是大O表示法:
1.用常数1来取代运行时间中所有加法常数。
2.修改后的运行次数函数中,只保留最高阶项
3.如果最高阶项存在且不是1,则去除与这个项相乘的常数。
计算算法时间复杂度的例子:
常数阶:
1 int sum = 0,n = 100; //执行一次 2 sum = (1+n)*n/2; //执行一次 3 System.out.println (sum); //执行一次
上面算法的运行的次数的函数为f(n)=3,根据推导大O阶的规则1,我们需要将常数3改为1,则这个算法的时间复杂度为O(1)。如果sum = (1+n)*n/2这条语句再执行10遍,因为这与问题大小n的值并没有关系,所以这个算法的时间复杂度仍旧是O(1),我们可以称之为常数阶。
线性阶
线性阶主要要分析循环结构的运行情况,如下所示。
1 for(int i=0;i<n;i++){ 2 //时间复杂度为O(1)的算法 3 ... 4 }
上面算法循环体中的代码执行了n次,因此时间复杂度为O(n)。
对数阶
1 int number=1; 2 while(number<n){ 3 number=number*2; 4 //时间复杂度为O(1)的算法 5 ... 6 }
可以看出上面的代码,随着number每次乘以2后,都会越来越接近n,当number不小于n时就会退出循环。假设循环的次数为X,则由2^x=n得出x=log₂n,因此得出这个算法的时间复杂度为O(logn)。
平方阶
下面的代码是循环嵌套:
1 for(int i=0;i<n;i++){ 2 for(int j=0;j<n;j++){ 3 //复杂度为O(1)的算法 4 ... 5 } 6 }
内层循环的时间复杂度在讲到线性阶时就已经得知是O(n),现在经过外层循环n次,那么这段算法的时间复杂度则为O(n²)。
接下来我们来算一下下面算法的时间复杂度:
1 for(int i=0;i<n;i++){ 2 for(int j=i;j<n;j++){ 3 //复杂度为O(1)的算法 4 ... 5 } 6 }
内层循环的执行频度为:
n+(n-1)+(n-2)+(n-3)+……+1
=(n+1)n/2
=n(n+1)/2
=n²/2+n/2
根据此前讲过的推导大O阶的规则的第二条:只保留最高阶,因此保留n²/2。根据第三条去掉和这个项的常数,则去掉1/2,最终这段代码的时间复杂度为O(n²)。
其他常见复杂度
除了常数阶、线性阶、平方阶、对数阶,还有如下时间复杂度:
f(n)=nlogn时,时间复杂度为O(nlogn),可以称为nlogn阶。
f(n)=n³时,时间复杂度为O(n³),可以称为立方阶。
f(n)=2ⁿ时,时间复杂度为O(2ⁿ),可以称为指数阶。
f(n)=n!时,时间复杂度为O(n!),可以称为阶乘阶。
f(n)=(√n时,时间复杂度为O(√n),可以称为平方根阶。
各时间复杂度随问题规模增长的变化率趋势:
绘图代码:
1 """ 2 @Author TZG 3 @Email 1651504722@qq.com 4 """ 5 6 import matplotlib.pyplot as plt 7 import numpy as np 8 from numpy.lib.scimath import logn 9 import matplotlib as mpl 10 from functools import reduce 11 12 #防止中文乱码问题 13 mpl.rcParams['font.sans-serif']=[u'SimHei'] 14 mpl.rcParams['axes.unicode_minus']=False 15 16 # 确定坐标轴 17 plt.xlim((0, 100)) 18 plt.ylim((0, 100)) 19 #设置坐标轴名称 20 plt.xlabel('输入规模') 21 plt.ylabel('时间') 22 23 # 产生等差数列 24 x = np.linspace(1, 101, 100) 25 26 27 # n 28 def f1(x): 29 y = x 30 return y 31 32 # n2 33 def f2(x): 34 y = x*x 35 return y 36 37 # 2n 38 def f3(x): 39 y = 2**x 40 return y 41 42 43 # n! 44 def f4(nd): 45 r = [] 46 for n in nd.tolist(): 47 r.append(reduce(lambda x,y:x*y,range(1,int(n+1)))) 48 return np.array(r) 49 50 plt.plot(x, logn(2,x), 'r-', linewidth=1, label='lgn') 51 plt.plot(x, f1(x), 'g-', linewidth=1, label="n") 52 plt.plot(x, x*logn(2,x), 'c-', linewidth=1, label="nlgn") 53 plt.plot(x, f2(x), 'm-', linewidth=1, label="n^2") 54 plt.plot(x, f3(x), 'y-', linewidth=1, label="2^n") 55 plt.plot(x, f4(x), 'k-', linewidth=1, label="n!") 56 57 # 在图上添加文字注释 58 # plt.text(10,20,'f(x)',size=13) 59 # plt.text(20,logn(2,[20]),'lgx',size=13) 60 61 # 将标记绘制图例 62 plt.legend(['lgn', 'n','nlgn','n^2','2^n','n!'], loc='upper left') 63 plt.show()
其中x轴代表n值,y轴代表T(n)值(时间复杂度)。T(n)值随着n的值的变化而变化,其中可以看出O(n!)和O(2ⁿ)随着n值的增大,它们的T(n)值上升幅度非常大,而O(logn)、O(n)、O(nlogn)随着n值的增大,T(n)值上升幅度则很小。
常用的时间复杂度按照耗费的时间从小到大依次是:
O(1)<O(logn)<O(n)<O(nlogn)<O(n²)<O(n³)<O(2ⁿ)<O(n!)
参考连接:
https://baike.baidu.com/item/%E6%97%B6%E9%97%B4%E5%A4%8D%E6%9D%82%E5%BA%A6/1894057?fr=aladdin
https://blog.csdn.net/itachi85/article/details/54882603