菜鸟学飞自学Python(五)高阶函数
(仅个人学习摘抄)
函数式编程
函数式编程就是一种抽象程度很高的编程范式,特点是允许把函数本身作为参数传入到另一个函数,还允许返回一个函数。
高阶函数
高阶函数——Higher-order function
变量可以指向函数
把函数本身赋值给变量
结论:函数本身也可以赋值给变量,即:变量可以指向函数。
一个变量指向一个函数,能否通过变量调用函数:
说明变量 f 现在已经指向了 abs 函数本身,直接调用 abs() 函数和调用变量 f() 完全相同。
函数名也是变量名
函数名其实就是指向函数的变量!
把 abs 指向其他对象:
把 abs 指向 10 后,就无法通过 abs(-10) 调用该函数了!因为 abs 这个变量已经不指向求绝对值函数而是指向一个整数 10!
实际中代码不可以这么写,要恢复 abs 函数,需要重启 Python 交互环境。
注:由于 abs 函数实际上是定义在 _builtin_ 模块中的,所以要让修改 abs 变量的指向在其他模块也生效,要用 _builtin_.abs = 10。
传入函数
既然变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称为高阶函数。
一个最简单的高阶函数:
当我们调用 add(-5,6,abs) 时,参数 x,y 和 f 分别接收 -5,6 和 abs,根据函数定义,我们可以推导出计算过程:
验证:
把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式。
map/reduce
map
map() 函数接收两个参数,一个是函数,一个是 Iterable,map 将传入的函数依次作用到序列的每个元素,并把结果作为新的 Iterator 返回。
例:一个函数 f(x)=x2,把函数作用在一个 list[1,2,3,4,5,6,7,8,9] 上,就可以用 map() 实现:
代码实现:
map() 传入的第一个参数是 f,即函数对象本身。由于结果 r 是一个 Iterator,Iterator 是惰性序列,因此通过 list() 函数让它把整个序列都计算出来并返回一个 list。
map() 函数作为高阶函数,事实上把运算规则抽象了,我们可以计算任意复杂的函数。
reduce
reduce 把一个函数作用在一个序列 [x1,x2,x3,...] 上,这个函数必须接受两个参数,reduce 把结果继续和序列的下一个元素做累计计算,其效果就是:
比如说对一个序列求和,就可以用 reduce 实现:
把序列 [1,3,5,7,9] 变换成整数 13579,reduce 就可以派上用场:
结合 map(),把 str 转换为 int 的函数:
整理成一个 str2int 的函数就是:
还可以用 lambda 函数进一步简化:
练习:
map_reduce.py
filter
Python 内建的 filter() 函数用于过滤序列。filter() 接受一个函数和一个序列。filter() 把传入的函数依次作用于每个元素,然后根据返回值是 True 还是 False 决定保留还是丢弃元素。
在一个 list 中,删掉偶数,只保留奇数:
把一个序列中的空字符串删掉:
filter() 这个高阶函数,关键在于正确实现一个“筛选”函数。filter() 函数返回的是一个 Iterator,也就是一个惰性序列,所以要强迫 filter() 完成计算结果,需要用 list() 函数获得所有结果并返回 list。
用 filter 求素数
计算素数一个方法是埃氏筛法
首先,列出从 2 开始的所有自然数,构造一个序列:
2,3,4,5,6,7,8,9,10,11,12,13,...
取序列的第一个数 2,它一定是素数,然后用 2 把序列的 2 的倍数筛掉:
3,,5,,7,,9,,11,,13,,17,,19,,...
取新序列的第一个数 3,它一定是素数,然后用 3 把序列的 3 的倍数筛掉:
5,,7,,,,11,,13,,,,17,,19,,...
取新序列的第一个数 5,然后用 5 把序列的 5 的倍数筛掉:
7,,,,11,,13,,,,17,,19,,...
不断筛下去,就可以得到所有的素数。
算法实现:
先构造一个从 3 开始的奇数序列生成器:
定义一个筛选函数:
定义一个生成器,不断返回下一个素数:
这个生成器先返回第一个素数 2,然后,利用 filter() 不断产生筛选后的新的序列。
由于 primes() 也是一个无限序列,所以调用时需要设置一个退出循环的条件:
练习:
输出回数
do_filter.py
字符串逆序输出方法:
1、字符串的索引
str[::-1]
2、借列表反转
t = input()
a = []
for i in range(len(t)):
a.append(t[i])
a.reverse()
print(a)
print(' '.join(a))
seb.join(str) 函数中 str 既可以是字符串也可以是列表,seb 是想要在 str 中间添加的字符,最后返回的结果都是字符串。
sorted(排序算法)
无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,可以直接比较,若是字符串或者两个 dict,直接比较数学上的大小没有意义,因此,比较的过程必须通过函数抽象出来。通常规定,对于两个元素 x 和 y,如果认为 x < y,则返回 -1,如果认为 x == y,则返回 0,如果认为 x > y,则返回 1,这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序。
Python 内置的 sorted() 函数就可以对 list 进行排序:
sorted() 函数也是一个高阶函数,它还可以接收一个 key 函数来实现自定义的排序,按绝对值大小排序:
key 指定的函数将作用于 list 的每个元素上,并根据 key 函数返回的结果进行排序。
字符串排序:
默认情况下,对字符串排序,是按照 ASCII 的大小比较的,由于 'Z'<'a',大写字母 Z 会排在小写字母 a 的前面。
忽略大小写,按照字母顺序排序,实际上先把字符串都变成大写(或者小写),再比较。
若进行反向排序,可传入第三个参数 reverse=True:
练习:
do_sorted.py
返回函数
函数作为返回值
高阶函数除了可以接受函数作为参数外,还可以把函数作为结果返回。
实现一个可变参数的求和,函数定义如下:
如果不是立刻求和,不返回求和结果,返回求和函数:
当我们调用 lazy_sum() 时,返回的并不是求和结果,而是求和函数:
调用函数 f 时,才真正计算求和的结果:
我们在函数 lazy_sum 中又定义了函数 sum,并且,内部函数 sum 可以引用外部函数 lazy_sum 的参数和局部变量,当 lazy_sum 返回函数 sum 时,相关参数和变量都保存在返回的函数中,这种称为“闭包(Closure)”的程序结构拥有极大的威力。
当我们调用 lazy_sum 时,每次调用都会返回一个新的函数,即使传入相同的参数:
f1() 和 f2() 的调用结果互不影响。
闭包
返回的函数在其定义内部引用了局部变量 args,所以,当一个函数返回了一个函数后,其内部的局部变量还被新函数引用,所以,闭包用起来简单,实现起来不容易。
返回的函数并没有执行,调用 f() 才执行。
上例中,每次循环,都创建了一个新的函数,然后,把创建的 3 个函数都返回了。
认为调用 f1(),f2() 和 f3() 结果应该是 1,4,9,但实际是:
因为返回的函数引用了变量 i,但它并不是立刻执行。等到 3 个函数都返回时,它们所引用的变量 i 已经变成了 3,因此最终结果为 9。
返回函数不要引用任何循环变量,或者后续会发生变化的变量。
若一定要引用循环变量,方法是再创建一个函数,用该函数的参数绑定循环变量当前的值,无论该循环变量后续如何更改,已绑定到函数参数的值不变:
结果:
return_func.py
匿名函数
当我们在传入函数时,有些时候,不需要显式地定义函数,直接传入匿名函数更加方便。
在 Python 中,对匿名函数提供了有限支持。以 map() 函数为例,计算 f(x)=x2 时,除了定义一个 f(x) 的函数外,还可以直接传入匿名函数:
可知,匿名函数 lambda x : x * x 实际上就是:
关键字 lambda 表示匿名函数,冒号前面的 x 表示函数参数。
匿名函数有个限制,就是只能有一个表达式,不用写 return,返回值就是该表达式的结果。
匿名函数有一个好处,以为函数没有名字,不必担心函数名冲突。此外,匿名函数也是一个函数对象,也可以把匿名函数赋值给一个变量,再利用变量来调用该函数:
同样,也可以把匿名函数作为返回值返回,比如:
装饰器
函数也是一个对象,函数对象可以被赋值给变量,通过变量也能调用该函数。
函数对象有一个 _name_ 属性,可以拿到函数的名字:
假设我们要增强 now() 函数的功能,在函数调用前后自动打印日志,但又不希望修改 now() 函数的定义,这种在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)
本质上,decorator 就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的 decorator,定义如下:
log 是一个 decorator,所以接受一个函数作为参数,并返回一个函数。我们借助 Python 的 @ 语法,把 decorator 置于函数的定义处:
调用 now() 函数,不仅会运行 now() 函数本身,还会在运行 now() 函数前打印一行日志:
把 @log 放到 now() 函数的定义处,相当于执行了语句:
now = log(now)
如果 decorator 本身需要传入参数,那就需要编写一个返回 decorator 的高阶函数,会更复杂。比如,要自定义 log 的文本:
3 层嵌套的 decorator 用法如下:
执行结果如下:
和两层嵌套的 decorator 相比,3 层嵌套的效果如下:
now = log('execute')(now)
在面向对象(OOP)的设计模式中,decorator 被称为装饰模式。OOP 的装饰模式需要通过继承和组合来实现,而 Python 除了能支持 OOP 的 decorator 外,直接从语法层次支持 decorator。Python 的 decorator 可以用函数实现,也可以用类实现。
decorator.py
偏函数
Python 的 functools 模块提供了许多有用的功能,其中一个就是偏函数(Partial function)
偏函数可以通过设定参数的默认值,降低函数调用的难度。
int() 函数可以把字符串转换为整数,当仅传入字符串时,int() 函数默认按十进制转换:
int() 函数还提供额外的 base 参数,默认值为 10.如果传入 base 参数,就可以做 N 进制的转换:
functools.partial 的作用是,把一个函数的某些参数给固定住(也就是设置默认值),返回一个新的函数,调用这个新函数会更简单。
小结
当函数的参数个数太多,需要简化时,使用 functools.partial 可以创建一个新的函数,这个新函数可以固定住原函数的部分参数,从而在调用时更简单。
do_partial.py