problem-solving-with-algorithms-and-data-structure-usingpython(使用python解决算法和数据结构) -- 算法分析

1. 计算前n个整数的和

def sumOfN(n):
    theSum = 0
    for i in range(1,n+1):
        theSum += i
    return theSum
print(sumOfN(10))
解法一
def sumOfN(n):
    return (n*(n+1))/2
print(sumOfN(10))
解法二

2. 乱序字符串检查

乱序字符串是指一个字符串只是另一个字符串的重新排列。
例如,'heart''earth' 就是乱序字符串。'python''typhon' 也是。
为了简单起见,我们假设所讨论的两个字符串具有相等的长度,并且他们由 26 个小写字母集合组成。
我们的目标是写一个布尔函数,它将两个字符串做参数并返回它们是不是乱序。
def anagramSolution1(s1,s2):
    alist = list(s2)
    pos1 = 0
    stillok = True
    while pos1 < len(s1) and stillok:
        pos2 = 0
        found = False
        while pos2 < len(alist) and not found:
            if s1[pos1] == alist[pos2]:
                found = True
            else:
                pos2 += 1
        if found:
            alist[pos2] = None
        else:
            stillok = False
        pos1 += 1
    return stillok

print(anagramSolution1('abcd', 'dcba'))
解法一:检查
即使 s1,s2 不同,它们都是由完全相同的字符组成的。
所以,我们按照字母顺序从 a 到 z 排列每个字符串,如果两个字符串相同,那这两个字符串就是乱序字符串。

def anagramSolution1(s1,s2):
    alist1 = list(s1)
    alist2 = list(s2)
    
    alist1.sort()
    alist2.sort()
    
    pos = 0
    matches = True
    
    while pos < len(s1) and matches:
        if alist1[pos] == alist2[pos]:
            pos += 1
        else:
            matches = False
    return matches

print(anagramSolution1('abcde', 'edcba'))
解法二:排序和比较
首先你可能认为这个算法是 O(n),因为只有一个简单的迭代来比较排序后的 n 个字符。
但是,调用 Python 排序不是没有成本。正如我们将在后面的章节中看到的,排序通常是O(n^2) 或 O(nlogn)。
所以排序操作比迭代花费更多。最后该算法跟排序过程有同样的量级。
算法分析
利用两个乱序字符串具有相同数目的 a, b, c 等字符的事实。
我们首先计算的是每个字母出现的次数。
由于有 26 个可能的字符,我们就用 一个长度为 26 的列表,每个可能的字符占一个位置。
每次看到一个特定的字符,就增加该位置的计数器。
最后如果两个列表的计数器一样,则字符串为乱序字符串。


def anagramSolution1(s1,s2):
    c1 = [0]*26
    c2 = [0]*26

    for i in range(len(s1)):
        pos = ord(s1[i]) - ord('a')     # ord 函数:返回对应的 ASCII 数值
        c1[pos] += 1
    for i in range(len(s2)):
        pos = ord(s2[i]) - ord('a')     # ord 函数:返回对应的 ASCII 数值
        c2[pos] += 1
    j = 0
    stillok = True
    while j < 26 and stillok:
        if c1[j] == c2[j]:
            j += 1
        else:
            stillok = False
    return stillok

print(anagramSolution1('apple', 'pleap'))
解法三:计数和比较
同样,这个方案有多个迭代,但是和第一个解法不一样,它不是嵌套的。
两个迭代都是 n, 第三个迭代,比较两个计数列表,需要 26 步,因为有 26 个字母。
一共T(n)=2n+26T(n)=2n+26,即 O(n),我们找到了一个线性量级的算法解决这个问题。
算法分析

3. 生成一个从0开始的n个数字的列表

def test1():
    l = []
    for i in range(1000):
        l = l + [i]
test1
def test2():
    l = []
    for i in range(1000):
        l.append(i)
test2
def test3():
    l = [i for i in range(1000)]
test3
def test4():
    l = list(range(1000))
test4

列表操作的效率

操作 O()值
index[] O(1)
append O(1)
pop() O(1)
pop(i) O(n)
insert(i,item) O(n)
del operator O(n)
iteration O(n)
contains(in) O(n)
get slice[x:y] O(k)
del slice O(n)
set slice O(n+k)

reverse

O(n)
concatenate O(k)
sort O(n*logn)
multiply O(n*k)

字典操作的效率

操作 O()值
copy O(n)
get item O(1)
set item O(1)
delete item O(1)
contains(in) O(1)
iteration O(n)

时间复杂性:https://wiki.python.org/moin/TimeComplexity

 

总结:

1. 算法分析是一种独立的测量算法的方法

2. 大O表示法允许根据问题的大小,通过其主要部分来对算法进行分类

 

posted @ 2018-08-04 23:48  李培冠  阅读(590)  评论(0编辑  收藏  举报