Python高级特性: 函数编程 lambda, filter,map,reduce

一、概述

Python是一门多范式的编程语言,它同时支持过程式、面向对象和函数式的编程范式。因此,在Python中提供了很多符合 函数式编程 风格的特性和工具。

以下是对 Python中的函数式编程 的简要总结,关于这一主题更全面的讨论可以参考 Functional Programming HOWTO

二、lambda表达式(匿名函数)

除了 Python基础:函数 中介绍的 def语句,Python还提供了另外一种定义函数的方法: lambda表达式

lambda表达式的语法如下:

lambda [arguments]: expression

与def语句类似,lambda表达式创建的函数:

  • 也是可调用对象(接受0个或多个参数,返回一个值)
  • 也是一等公民(first-class)
  • 具有同样的 参数风格作用域规则
  • 也支持嵌套定义(def中的lambda,或lambda中的lambda)

但是lambda表达式与def语句之间,也存在很多显著的差异:

差异点函数(lambda表达式)函数(def语句)
函数体 只能是单行表达式(expression 可以是任意复杂的语句(statement
函数返回值 返回值就是函数体中的表达式的求值结果 由函数体中的return语句指定 返回值
函数名 定义后直接返回函数对象(匿名函数 定义后自动为函数对象绑定函数名
函数定义位置 可以在任何允许函数对象出现的位置定义(支持即时定义,即时调用) 只能在允许语句出现的位置定义(先定义,后调用)
用途 多用于一次性使用的简单函数 适用于一切函数和类方法

以下是lambda表达式的简单示例:

# def语句
>>> def func(x, y): return x + y # 自动绑定函数名为func
... 
>>> func
<function func at 0xb76eff7c>
>>> func(1, 2) # 先定义,后调用
3

# lambda表达式
>>> lambda x, y: x + y # 匿名函数(直接返回函数对象)
<function <lambda> at 0xb76ef0d4>
>>> (lambda x, y: x + y)(1, 2) # 即时定义,即时调用
3
>>> f = lambda x, y: x + y # 手动绑定函数名
>>> f(1, 2) # 也可以先定义,后调用
3
>>> 
>>> ((lambda x: (lambda y: x + y))(1))(2) # 嵌套定义的lambda(较复杂,尽量避免)
3

三、内建函数filter()、map()、reduce()

1、filter()

函数原型:filter(function, iterable)

说明:返回一个由iterable中的某些元素组成的列表,这些元素使得function返回True。若iterable为字符串(或元组),则返回字符串(或元组);否则,总是返回列表。如果function为None,则默认为恒等函数(identity function,类似 f(x) = x)。

示例:

# for循环版本
>>> res = []
>>> for x in 'a1b2c3d4e5f6':
...     if x.isalpha():
...         res.append(x)
... 
>>> res
['a', 'b', 'c', 'd', 'e', 'f']

# filter版本
s = 'a1b2c3d4e5f6'
>>> filter((lambda x: x.isalpha()), s) # iterable为字符串,则返回字符串
'abcdef'
>>> filter((lambda x: x.isalpha()), tuple(s)) # iterable为元组,则返回元组
('a', 'b', 'c', 'd', 'e', 'f')
>>> filter((lambda x: x.isalpha()), list(s)) # iterable为其他迭代对象,则返回列表
['a', 'b', 'c', 'd', 'e', 'f']
>>> filter(None, list(s)) # function为None,则默认为恒等函数
['a', '1', 'b', '2', 'c', '3', 'd', '4', 'e', '5', 'f', '6']

2、map()

函数原型:map(function, iterable, ...)

说明:逐个以iterable中的元素为参数调用function,并返回结果的列表。如果存在多个iterable,则以最长的为准(其他不足的 补None),逐个并行取出元素作为参数调用function(如map(function, iter1, iter2)会返回列表[function(iter1[0], iter2[0]), function(iter1[1], iter2[1]), ...])。如果function为None,则默认为恒等函数。

示例:

# for循环版本
>>> res = []
>>> for x in [1, 2, 3, 4, 5]:
...     res.append(x ** 2)
... 
>>> res
[1, 4, 9, 16, 25]

# map版本
>>> map((lambda x: x ** 2), [1, 2, 3, 4, 5])
[1, 4, 9, 16, 25]
>>> map(None, [1, 2, 3, 4, 5]) # function为None,则默认为恒等函数
[1, 2, 3, 4, 5]
>>> map((lambda x, y: x + y), [1, 2, 3], [4, 5, 6]) # 存在多个iterable,则返回[1+4, 2+5, 3+6]
[5, 7, 9]
>>> map(None, [1, 2, 3], [4, 5]) # 以最长的iterable为准,其他不足的补None
[(1, 4), (2, 5), (3, None)]

3、reduce()

函数原型:reduce(function, iterable[, initializer])

说明:以累加方式逐个取出iterable中的元素作为参数调用(具有双参数的)function,从而最终将iterable简化为一个值(如 reduce(function, [1, 2, 3])会返回function(function(1, 2), 3))。如果存在initializer,则在累加调用中,以它作为初始的第一个参数。function必须是可调用对象(不能为None)。

示例:

# for循环版本
>>> total = 0
>>> for x in [1, 2, 3, 4, 5]:
...     total += x
... 
>>> total
15

# reduce版本
>>> reduce((lambda x, y: x + y), [1, 2, 3, 4, 5]) # 相当于((((1+2)+3)+4)+5)
15
>>> reduce((lambda x, y: x + y), [1, 2, 3, 4, 5], 10) # 带有initializer的reduce,相当于(((((10+1)+2)+3)+4)+5)
25
>>> sum([1, 2, 3, 4, 5], 10) # 等效于上面的reduce
25

四、闭包

闭包(closure)是一个内嵌函数,它能够记住其 外围作用域 中的所有名字,即使这个作用域 看起来 已经不在外围。

在以下示例中,内嵌函数action就是一个闭包:

>>> def maker(N):
...     def action(x):
...         return x * N
...     return action
... 
>>> mul10 = maker(10)
>>> mul10(3)
30
>>> mul10(5)
50

尽管函数调用mul10 = maker(10)已经返回并退出了,但后续的mul10却能够记住整数10,从而计算入参的10倍数。

实际上,外围作用域(如函数maker对应的代码范围)中的所有名字(如参数N)都作为环境信息被绑定到了action函数上,因此每次调用action时都可以访问这些环境信息。特别地,可以通过特殊属性func_closure来获取一个函数的自由变量绑定:

>>> def maker(N):
...     def action(x):
...         return x * N
...     print(action.func_closure) # 打印出action函数的func_closure属性值
...     return action
... 
>>> N = 10
>>> print('int N: id = %#0x, val = %d' % (id(N), N)) # N的值为10(整数10的地址是0x8e82044)
int N: id = 0x8e82044, val = 10
>>> mul10 = maker(N) # action.func_closure中含有整数10(即自由变量N)
(<cell at 0x90e96bc: int object at 0x8e82044>,)

闭包的这种 能够记住环境状态 的特性非常有用,Python中有一些其他特性就是借助闭包来实现的,比如 装饰器

五、偏函数应用

1、基本用法

偏函数应用Partial Function Application)是一种简化函数调用的方式,主要表现为对函数的部分参数进行固化。

Python中的偏函数应用是借助 functools.partial 来完成的。例如有一个专用于生成文章标题的函数title:

>>> def title(topic, part):
...     return topic + u':' + part
...

如果要为 『Python基础』 系列的多篇文章生成标题,可以有以下两种方式:

# 普通版本
>>> print title(u'Python基础', u'开篇')
Python基础:开篇
>>> print title(u'Python基础', u'函数')
Python基础:函数
>>> print title(u'Python基础', u'函数式编程')
Python基础:函数式编程

# 偏函数版本
>>> from functools import partial
>>> pybasic_title = partial(title, u'Python基础')
>>> print pybasic_title(u'开篇')
Python基础:开篇
>>> print pybasic_title(u'函数')
Python基础:函数
>>> print pybasic_title(u'函数式编程')
Python基础:函数式编程

从上面的示例可以看出,如果在编码过程中遇到了“多次用相同的参数调用一个函数”的场景,就可以考虑使用偏函数来固化这些相同的参数,进而简化函数调用。

2、等效实现

1)默认参数

在上述示例中,如果将函数title的定义改为def title(part, topic=u'Python基础')也可以达到相同的效果。但是这种方式的不足之处也很明显:

  • 需要修改已有函数title的定义
  • 默认参数只能有一个固定值,定义后即不能更改

相比之下,偏函数具有很好的灵活性:既不用修改已有函数的定义,又可以为函数的参数固化不同的值。

2)lambda表达式

使用 lambda表达式 也可以实现类似偏函数的功能,并且与默认参数不同的是,可以针对不同的参数值定义不同的lambda表达式(因为lambda表达式通常是一次性使用的)。例如上述示例中的pybasic_title也可以实现为:

>>> pybasic_title = (lambda part: u'Python基础:' + part)
>>> print pybasic_title(u'开篇')
Python基础:开篇
>>> print pybasic_title(u'函数')
Python基础:函数
>>> print pybasic_title(u'函数式编程')
Python基础:函数式编程

但是,由于lambda表达式本身的限制(参考 『lambda表达式』 一节),在具有复杂函数的场景中,还得使用偏函数。

3)闭包

最后,使用 闭包 同样可以等效地实现偏函数的功能,并且与lambda表达式不同的是,它没有任何限制场景。还是上面的例子:

>>> def title(topic):
...     def topic_title(part):
...         return topic + u':' + part
...     return topic_title
... 
>>> pybasic_title = title(u'Python基础')
>>> print pybasic_title(u'开篇')
Python基础:开篇
>>> print pybasic_title(u'函数')
Python基础:函数
>>> print pybasic_title(u'函数式编程')
Python基础:函数式编程

可以看出,这个闭包版本的唯一缺点是它需要对函数title进行重新定义(与默认参数的情况有些类似)。

总而言之,如果需要对 已有函数 进行参数固化,偏函数是最佳选择。

六、列表解析

关于 列表解析(List Comprehensions),在 Python基础:序列(列表、元组) 中有过简单介绍。

这里主要强调两点:

  • 列表解析可以用来代替上面提到的一些函数式编程方法
  • 列表解析还有一个生成器版本的近亲:生成器表达式

1、用列表解析代替filter()和map()

1)filter()

列表解析可以完全代替filter():

  • function不为None时:[item for item in iterable if function(item)]等价于filter(function, iterable)
  • function等于None时:[item for item in iterable if item]等价于filter(None, iterable)

2)map()

在以下情况中,列表解析可以代替map():

  • 只有一个iterable时
    • function不为None:[function(item) for item in iterable]等价于map(function, iterable)
    • function等于None:[item for item in iterable]等价于map(None, iterable)
  • 多个iterable长度相同时
    • function不为None:[function(*args) for args in zip(iter1, iter2, ...)]等价于map(function, iter1, iter2, ...)
    • function等于None:zip(iter1, iter2, ...)等价于map(None, iter1, iter2, ...)

如果多个iterable具有不同的长度,那么列表解析就无法代替map()了。

2、生成器表达式

生成器表达式(Generator Expressions)与列表解析在语法和功能方面都非常相似。二者的根本差异是:生成器表达式返回一个 生成器,而列表解析返回一个列表。如下所示:

差异点生成器表达式列表解析
表示方法 (expr for item in iterable if cond_expr) [expr for item in iterable if cond_expr]
返回值 一个生成器 一个列表

与列表解析相比,生成器表达式具有 延迟计算(lazy evaluation)的特点,因此在使用内存上更有效。关于生成器表达式的实际案例,可以参考 Python核心编程(第二版) 中的 『8.13』 一节:『生成器表达式』。

posted @ 2017-12-15 14:36  曾先森在努力  阅读(172)  评论(0编辑  收藏  举报