使用缓存的计算属性

在Python中,将方法变为属性使用@property的装饰器。有时候,为了提高性能,想在仅首次调用方法property时进行计算,后续则使用缓存的值。
此时,可以使用一个类装饰器,如下:

class LazyProperty(object):
    def __init__(self, func):
        self.func = func

    def __get__(self, instance, cls):
        if instance is None:
            return self
        value = self.func(instance)
        setattr(instance, self.func.__name__, value)
        return value

关于__get__, _set_, __delete__等方法的使用,可以参考描述符的参考文章,内容较多。
可以按如下方式使用:

import math


class Circle(object):
    def __init__(self, radius):
        self.radius = radius

    @LazyProperty
    def area(self):
        print('Computing area')
        return math.pi * self.radius ** 2

    @LazyProperty
    def perimeter(self):
        print('Computing perimeter')
        return 2 * math.pi * self.radius

>>> c = Circle(4.0)
>>> c.radius 
4.0
>>> c.area 
Computing area 
50.26548245743669 
>>> c.area 
50.26548245743669 
>>> c.perimeter 
Computing perimeter 
25.132741228718345 
>>> c.perimeter 
25.132741228718345 
>>>

可以看出,在首次调用c.area或c.perimeter时,会使用LazyProperty的__get__方法,而在第二次及之后的调用中,直接得到了计算的值。原因是使用@LazyProperty时,area和perimeter此时变为描述符对象,在进行属性访问时,若定义了描述符类的__get__, _set_, delete__时,会分别调用各自的方法。调用顺序和是否仅定义__get__有关。若仅定义_get,则为非数据描述符(non-data descriptor),若定义了_set__或__delete,则为数据描述符(data descriptor)。详细文档可参考Implementing Descriptors
在第一次调用area和perimeter时,会计算实际的值,然后调用setattr方法将函数名和值存入instance的__dict__中。下次调用时,又因为仅定义了__get__方法,没有定义__set__和__delete__,故该描述符仅为非数据描述符。非数据描述符在属性访问时,会被对象的底层字典属性所覆盖。
The important points to remember are:

  • descriptors are invoked by the _getattribute_() method
  • overriding _getattribute_() prevents automatic descriptor calls
  • object._getattribute_() and type._getattribute_() make different calls to _get_().
  • data descriptors always override instance dictionaries.
  • non-data descriptors may be overridden by instance dictionaries.

该实现方案的一个潜在缺陷是,若进行如下操作,则可以修改已计算的值,造成数据失真:

>>> c.area 
Computing area 
50.26548245743669 
>>> c.area = 25
 >>> c.area
25
>>>

有人可能会说,可以给LazyProperty添加__set__方法,方法内部直接抛出raise AttributeError("Cannot change the value")。但添加__set__的同时,会改变属性的访问优先级,此时缓存失效。调用area和perimeter时,每次都是调用底层的__get__,每次都会计算值。

此时,可以使用方法装饰器,如下:

def lazy_property(func):
    name = '_lazy_' + func.__name__
    @property
    def lazy(self):
        if hasattr(self, name):
            return getattr(self, name)
        value = func(self)
        setattr(self, name, value)
        return value
    return lazy


class Circle:
    def __init__(self, radius):
        this.radius = radius

    @lazy_property
    def area(self):
        print('Computing area')
        return math.pi * self.radius ** 2

    @lazy_property
    def perimeter(self):
        print('Computing perimeter')
        return 2 * math.pi * self.radius
posted @ 2019-12-29 18:58  Jeffrey_Yang  阅读(293)  评论(0编辑  收藏  举报