编写高质量Python代码的59个有效方法

第17条:在参数上面迭代是,要多加小心

def read_visits(data_path):
    with open(data_path) as f:
        for line in f:
            yield int(line)

visits = read_visits("./my_numbers.txt")
print(list(visits))
print(list(visits))
print(list(visits))

 

 产生这个结果的原因是:迭代器只能产生一轮结果,在抛出StopIteration异常的迭代器或生成器 上面继续迭代第二轮,是不会有结果的

解决办法:实现迭代器协议的容器类:

class ReadVisits(object):
    def __init__(self, data_path):
        self.data_path = data_path

    def __iter__(self):
        with open(self.data_path) as f:
            for line in f:
                yield int(line)

def normalize_defensive(numbers):
    if iter(numbers) is iter(numbers):
        raise TypeError("Must supply a container")
    total = sum(numbers)
    result = []
    for value in numbers:
        percent = 100 * value / total
        result.append(percent)
    return result

numbers = ReadVisits("./my_numbers.txt")
result = normalize_defensive(numbers)
print(result)

迭代器协议约定:

  如果把迭代器对象传给内置的iter函数,那么此函数会把该迭代器返回,反之,如果传给iter函数的是个容器类型的对象,那么iter函数则每次都会返回新的迭代器对象。

要点:

  函数在输入的参数上面多次迭代时要当心:如果参数是迭代器,那么可能会导致奇怪的行为并错失某些值。

  Python的迭代器协议,描述了容器和迭代器应该如何与iter和next内置函数、for循环及相关表达式相互配合。

  把__iter__方法实现为生成器,即可定义自己的额容器类型。

  想判断某个值是迭代器还是容器,可以拿该值为参数,两次调用iter函数,若结果相同,则是迭代器,调用内置的next函数,即可令该迭代器前进一步。

 

第18条:用数量可变的位置参数减少视觉杂讯

要点:

  在def语句中使用*args,即可令函数接受数量可变的位置参数。

  调用函数时,可以采用*操作符,把序列中的元素当成尾椎参数,传给函数。

  对生成器使用*操作符,可能导致程序耗尽内存并崩溃。

  在已经接受*args参数的函数上面继续添加位置参数,可能会产生难以排查的bug。

 

第20条:用None和文档字符串来描述具有动态默认值的参数

要点:

  参数的默认值,只会在程序加载模块并读到本函数的定义时评估一次。对于{}或[]等动态的值,这可能会导致奇怪的行为。

  对于以动态值作为实际默认值的关键字参数来说,应该把形式上的默认值写为None,并在函数的文档字符串里面描述该默认值所对应的时间行为。

 第22条:尽量用辅助类来维护程序的状态,而不要用字典和元组

import collections

Grade = collections.namedtuple("Grade", ("score", "weight"))


class Subject(object):
    def __init__(self):
        self._grades = []

    def report_grade(self, score, weight):
        self._grades.append(Grade(score, weight))

    def average_grade(self):
        total, total_weight = 0, 0
        for grade in self._grades:
            total += grade.score * grade.weight
            total_weight += grade.weight

        return total / total_weight


class Student(object):
    def __init__(self):
        self._subjects = {}

    def subject(self, name):
        if name not in self._subjects:
            self._subjects[name] = Subject()
        return self._subjects[name]

    def average_grade(self):
        total, count = 0, 0
        for subject in self._subjects.values():
            total += subject.average_grade()
            count += 1

        return total / count


class Gradebook(object):
    def __init__(self):
        self._students = {}

    def student(self, name):
        if name not in self._students:
            self._students[name] = Student()

        return self._students[name]


book = Gradebook()
albert = book.student("Albert Einstein")
math = albert.subject("Math")
math.report_grade(80, 0.10)

print(albert.average_grade())

要点:

  不要使用包含其他字典的字典,也不要使用过长的元组;

  如果容器中包含简单而又不可变的数据,那么可以先使用namedtuple来表示,待稍后有需要时,再修改为完整的类;

  保存内部状态的字典如果变得比较复杂,那就应该把这些代码拆解为多个辅助类。

第23条:简单的接口应该接受函数,而不是类的实例

 

posted @ 2020-05-25 18:20  顽强的allin  阅读(590)  评论(0编辑  收藏  举报