Python 练习题总结(待续)

1、编写一个函数,接受一个参数n,n为正整数,左右两种打印方 式。要求数字必须对齐

正三角

倒三角

实现思路:

思路1、一行一行打印,前面追加空格,每一个空格的宽度等于数字字符串的宽度

#正三角打印
def
triangle(k): for a in range(1,k+1): a =1 for b in range(k,0,-1): a=15 if a < b: print(' '*len(str(b)),end=' ') else: print(b,end=' ') print()

思路2、切割打印,首先每个数字隔一个空格,获取长度,当遇到遇到一个空格,就把前面全部补成空格后面数字和空格全部打印。

#正三角打印
def triangle2(n):
    tail=" ".join([str(i) for i in range(n,0,-1)])
    width = len(tail)
    for i in range(-1,-width,-1): 
        if tail[i] == ' ':#1
            print(' '*(width+i),tail[i+1:])
    print(tail)
#倒三角打印
def triangle1(n):
    tail=" ".join([str(i) for i in range(n,0,-1)])
    print(tail)
    for i in range(len(tail)):
        if tail[i] == ' ':
            print(' '*i,tail[i+1:])

 2、阶乘解法

思路分析:

阶乘即n!=1×2×3×...×n。阶乘亦可以递归方式定义:0!=1,n!=(n-1)!×n。

1、函数解法

#方法1
def fac(n):
    if n == 1:
        return 1
    return n * fac(n-1)
print(fac(4))

#方法2
def fac1(n,fac=1): #n=4 fac=1  #n=3,fac=4 #n=2,fac=12 #n=1 fac=24
    if n == 1: #4 3 2  1 
        return fac  #24
    fac = fac * n # fac=4 #fac = 12 #fac=24
    return fac1(n-1,fac) # fac(3,4) #fac(2,12) #fac(1,24)
print(fac1(4))

 2、for 循环解法

fac = 1
for a in range(1,5):
    fac *= a
print(fac)

 

3、猴子吃桃

思路分析:

#假设猴子摘x个桃
d1  x //2 - 1
d2  d1//2 - 1
d3  d2//2 - 1
...
d9  d8//2 - 1
d10 1
#猴子偷桃
"""
猴子第一天摘下若干桃子,当即吃了一半,还不过瘾,又多吃了一个,第二天早上又将剩下的桃子吃掉一半,又多吃了一个。
以后每天早上又将剩下的桃子吃掉一半,又多吃一个。以后每天早上都吃前一天剩下的一半零一个。到第10天早上想吃的时候,
只剩下一个桃子,求第一天工摘多少桃子
"""
def peach(days=10): 
    if days == 1:
        return 1
    return 2*(peach(days-1)+1) 
print(peach(days=10))

4、将一个数逆序放入列表中,例如:1234 -->[4,3,2,1]

#方法一 递归切片
def revert(x,data=[]):
    if x:
        data.append(x[-1])
        revert(x[:-1])
    return data
print(revert("98adad123"))
#方法二 使用数字整除取模递归
def revert(x, target=None): #x="123045"  #12304 [5,]
    if target is None:
        target = []    #target = [] 
    x, y = divmod(x, 10) # x=12304 y=5 # x=1230 y=4
    target.append(y) #target = [5,]  #[5,4]
    if x == 0: 
        return target
    return revert(x, target) #12304 [5,] #1230 [5,4]
print(revert(123045))

 5、字典扁平化(主要练习递归)

源字典 {'a':{'b':1,'c':2}, 'd':{'e':3,'f':{'g':4}}} 目标字典 {'a.c': 2, 'd.e': 3, 'd.f.g': 4, 'a.b': 1}

 

src={"a":{"b":1,"c":2},"d":{"e":4,"f":{"g":3}}}
def dst(src:dict,prekey="",targetdct = {}):
    for k,v in src.items():
        if isinstance(v,dict):
            prekey=prekey + k + "."
            dst(v,prekey)
            prekey = ""
        else:
            targetdct[prekey + k] = v
 #
    return targetdct
print(dst(src))

 

6、实现base64编码

Base64编码核心思想: 每3个字节断开,拿出一个3个字节,每6bit断开成4段。 因为每个字节其实只占用了6 位, 2**6 = 64 ,因此有了base64的编码表。 每一段当做一个8bit看它的值,这个值就是Base64编码表的索引 值,找到对应字符。 再取3个字节,同样处理,直到最后。

举例: abc对应的ASCII码为:0x61 0x62 0x63 01100001 01100010 01100011 # abc 011000 010110 001001 100011 00011000 00010110 00001001 00100011 # 6位补齐为824 22 9 35

问题: 一个字节能变成几个Base64的字节? 两个字节能变成几个Base64的字节? 字符串'`'反引号如何处理? 末尾的处理? 1、正好3个字节,处理方式同上 2、剩1个字节或2个字节,用0补满3个字节 3、补0的字节用=表示

 

alphabet = b"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
def base64encode(src:str):
    ret = bytearray()
    if isinstance(src, str):
        _src = src.encode()
    else:
        return
    length = len(_src)

    r = 0
    for offset in range(0, length, 3):
        triple = _src[offset:offset + 3]  # 切片边界可以超界
        # print(triple)
        if offset + 3 > length:
            r = 3 - len(triple)
            triple += b'\x00' * r  # 便于计算先补零
        b = int.from_bytes(triple, 'big')
        for i in range(18, -1, -6):
            if i == 18:
                index = b >> i
            else:
                index = b >> i & 0x3F # 0b11 1111
            ret.append(alphabet[index])  # 索引查表
    if r:
        ret[-r:] = b'=' * r  # 从索引-r到末尾使用右边的多个元素依次替换
    return bytes(ret)
import base64
strlist = ['a', '`', 'ab', 'abc', 'abcd', "ManMa", '教育a']
for x in strlist:
    print(x)
    print(base64encode(x))
    print()

 

 

7、求2个字符串的最长公共子串

思考: s1 = 'abcdefg' s2 = 'defabcd'

方法一:矩阵算法 让s2的每一个元素,去分别和s1的每一个元素比较,相同就是1,不同就是0,有下面的矩阵

  s1
s1 0001000
s1 0000100
s1 0000010
s1 1000000
s1 0100000
s1 0010000
s1 0001000

 

上面都是s1的索引。 看与斜对角线平行的线,这个线是穿过1的,那么最长的就是最长子串。 print(s1[3:3+3]) print(s1[0:0+4]) 最长

矩阵求法,需要一个字符扫描最长子串的过程,扫描的过程就是len(s1) * len(s2)次,O(n * m),这是必须的。 难 道还需要遍历一遍找出谁才是最长的吗?能够在求矩阵过程中就找出最长的子串吗? 0001000 第一行,索引为 (3,0)。 第二行的时候如果索引(4,1)处是1,就判断(3,0)处是否为1,为1就把(3,0)处加1。 第二行的时候如果索引 (5,2)处是1,就判断(4,1)处是否为1,是1就加1,再就判断(3,0)处是否为1,为1就把(3,0)1

  s1
s1 0003000
s1 0000200
s1 0000010
s1 4000000
s1 0300000
s1 0020000
s1 0001000

 

上面的方法是个递归问题,不好。 最后在矩阵中找到最大的元素,从它开始就能写出最长的子串了。 但是这个不 好算,因为是逆推的,改为顺推。

  s1
s1 0001000
s1 0000200
s1 0000030
s1 1000000
s1 0200000
s1 0030000
s1 0004000

 

顺推的意思,就是如果找到一个就看前一个的数字是几,然后在它的基础上加1

 

def findstr(str1:str,str2:str):
    lenght1,lenght2=len(str1),len(str2)
    matrix = [[0]*lenght1 for i in range(lenght2)]
#从x轴或者y轴取都可以,选择x轴,xmax和xindex
    xmax = 0
    xindex = 0
    for i,x in enumerate(str2):
        for j,y in enumerate(str1):
            if x != y:
                pass
            else:
                if i == 0 or j == 0 :
                    matrix[i][j] = 1
                else:
                    matrix[i][j] = matrix[i-1][j-1] + 1

                if matrix[i][j] >xmax:
                    xmax = matrix[i][j]
                    xindex = j
    start = xindex + 1 - xmax
    end = xindex + 1
    print(matrix, xmax, xindex, start, end)
    return str1[start:end]
s1 = 'abcdefg'
s2 = 'defabcd'
s2 = 'defabcdoabcdeftw'
s3 = '1234a'
s4 = "5678"
s5 = 'abcdd'
print(findstr(s1, s2))
print(findstr(s1, s3))
print(findstr(s1, s4))
print(findstr(s1, s5))

 

方法二:可不可以这样思考? 字符串都是连续的字符,所以才有了下面的思路。

 

思路一: 第一轮 从s1中依次取1个字符,在s2查找,看是否能够找到子串。 如果没有一个字符在s2中找到,说明 就没有公共子串,直接退出。如果找到了至少一个公共子串,则很有可能还有更长的公共子串,可以进入下一轮。

第二轮 然后从s1中取连续的2个字符,在s2中查找,看看能否找到公共的子串。如果没找到,说明最大公共子串就 是上一轮的随便的哪一个就行了。如果找到至少一个,则说明公共子串可能还可以再长一些。可以进入下一轮。

改进 其实只要找到第一轮的公共子串的索引,最长公共子串也是从它开始的,所以以后的轮次都从这些索引位置开 始,可以减少比较的次数。

思路二: 假设s1s2两个字符串,s1短一些。 既然是求最大子串,最长子串不会超过最短的字符串,先把s1全长 作为子串。 在s2中搜索,是否返回正常的index,正常就找到了最长子串。

没有找到,把s1按照length-1取多个子串。 在s2中搜索,是否能返回正常的index

注意: 不要一次把s1的所有子串生成,用不了,也不要从最短开始,因为题目要最长的。 但是也要注意,万一他 们的公共子串就只有一个字符,或者很少字符的,思路一就会占优势。

 

s1 = 'abcdefg'
s2 = 'defabcdoabcdeftw'
s3 = '1234a'
def findstr(str1:str,str2:str):
    count = 0  # 计数,看看效率
    if len(str2) < len(str1):  # str2更短
        str1, str2 = str2, str1
    length = len(str1)
    for sublen in range(length, 0, -1):
        for start in range(0, length - sublen + 1):
            substr = str1[start:start + sublen]  # 切割子串
            count += 1
            if str2.find(substr) > -1: # found
                print("count={}, substrlen={}".format(count, sublen))
                return substr

print(findstr(s1,s2))
print(findstr(s1,s3))

 

8、实现COPY函数

指定一个源文件,实现copy到目标目录

例如把/tmp/test.txt 复制到 /tmp/test1.txt

file1="/tmp/test.txt"
file2="/tmp/test1.txt"

f = open(file1,"w")
lines=["abc","123","jaxzhai"]
f.writelines("\n".join(lines))
#f.seek(0)
#print(f.read())
f.close()
def copy(src,dest):
    with open(src) as f1:
        with open(dest,"w") as f2:
            f2.write(f1.read())
copy(file1,file2)

9、单词统计

有一个文件,对其进行单词统计,不区分大小写,并显示单词重复最多的10个单词

#方法1

filename = 'sample.txt'
d = {}
with open(filename, encoding='utf8') as f:
    for line in f:
        words = line.split()
        for word in map(str.lower, words):
            d[word] = d.get(word, 0) + 1
print(sorted(d.items(), key=lambda item: item[1], reverse=True))
# 或使用缺省字典
from collections import defaultdict
d = defaultdict(lambda :0)
with open(filename, encoding='utf-8') as f:
    for line in f:
        words = line.split()
        for word in map(str.lower, words):
            d[word] += 1
print(sorted(d.items(), key=lambda item: item[1], reverse=True))
  
这里统计的不是很全,上面的原文件是帮助文档中的path文档,path应该很多,可以通过下面代码查看:
for k in d.keys(): # 从key里面看看还有好多带有path的 
    if k.find('path') > -1:
        print(k) 

使用上面的代码,就可以看到path非常多 os.path.exists(path) 可以认为含有2path

 

# 思路:遇到特殊字符,就用空格替代 
def makekey(s:str):
chars = set(r"""!'"#./\()[],*-""") key = s.lower() ret = [] for i, c in enumerate(key): if c in chars: ret.append(' ') else: ret.append(c) return ''.join(ret).split() d = {} with open('sample', encoding='utf8') as f: for line in f: words = line.split() for wordlist in map(makekey, words): for word in wordlist: d[word] = d.get(word, 0) + 1 for k,v in sorted(d.items(), key=lambda item: item[1], reverse=True): print(k,v)

分割key的另一种思路

def makekey1(s:str): #[os.path ]
    chars = set(r"""!'"#./\()[],*-""")
    key = s.lower()
    ret = []
    start = 0
    for i, c in enumerate(key): #
        if c in chars:
            if start == i:  # 如果紧挨着还是特殊字符,start一定等于i
                start += 1 # 加1并continue
                continue
            ret.append(key[start:i])
            start = i + 1  # 加1是跳过这个不需要的特殊字符c
    else:
        if start < len(key):  # 小于,说明还有有效的字符,而且一直到末尾
            ret.append(key[start:])
    return ret

d = {}
with open(filename, encoding='utf8') as f:
    for line in f:  #11.2. os.path — Common pathname manipulations
        words = line.split()  #[..,os.path,..]
        for wordlist in map(makekey1, words): #[os,path]
            for word in wordlist:
                d[word] = d.get(word, 0) + 1
for k, v in sorted(d.items(), key=lambda item: item[1], reverse=True):
    print(k, v)

 

 

 

 

 

posted @ 2019-07-23 17:19  大胖猴  阅读(483)  评论(0编辑  收藏  举报