tech 浅谈 Yield
Yield是Python中非常有意思的东西,下面粗略谈谈我对Yield的认识。
yield,在英文中有“产生、生产、收益“的意思,Python中的yield,也是说的“产生”,但奇特之处在于,yield能中断函数(同时保存函数的状态),而“产生”出一个中间结果。
设想这样一个情形吧:某个文件,每一行对应一个数据,程序需要依次处理所有这些数据。如果数据不多,我们可以把这些数据读到一个集合中,通过循环来处理,这也是常用的办法;但如果数据太多,一次读到内存中就会导致性能问题,所以我们通常会“分批”读入,或者把处理函数“注入”到读入程序中,但是,这些办法都不够“美观”。
其实,我们仔细想想就会明白,理想的办法应该是像“挤牙膏”那样,从外部每调用一次,“挤”出一行,处理完再“挤”出下一行,再处理,这里说的“挤”,就是yield。
下面这个程序,就可以显示yield的神奇之处。
>>>def byLineReader(filename) :
>>> f = open(filename)
>>> line = f.readline()
>>> while line :
>>> yield line
>>> line = f.readline()
>>> f.close()
>>> yield None
这样,我们如果需要读入文件,逐行处理,只需要这样
>>>reader = byLineReader(somefile)
>>>line = reader.next()
>>>processLine(line)
>>>while line:
>>> line = reader.next()
>>> processLine(line)
许多时候,妥善使用yield,不但能节省空间,还能提高效率(每次生成一个结果,随即处理这个结果,有利于程序之间的协作,xrange比range要快,也是这个原因),只是它有点违背大家长期以来的思维习惯。针对yield,我们不妨记住,它适合处理“在循环(或迭代)中返回一系列结果”的场合,这样会比较容易一些。(举个简单的例子,如果我们需要从Fibonacci数列中,找出前几个“符合某条件”的数字,传统的办法大概是,预先计算数列的前若干个数,再逐一检查,或者将判断条件“插入”数列计算函数,但是如果我们把yield写入Fibonaccis数列的生成函数,就好办多了,这样不但省却了无用功,功能的分隔也做得很好)。
不过,yield还有另一点奇妙之处,除了用来“产生”中间结果,它也可以将客户端(调用方)的信息“传进来”,让客户端逐步“控制”函数。在这里,“传进来”,使用的是send函数。
来看下面这个程序:
>>>def controlByYield():
>>> print “A function controlled by yield”
>>> while True :
>>> command = (yield)
>>> if command :
>>> print command
这个函数,每一步接受一次“命令”:
>>>controller = controlByYield()
>>>controller.next()
A function controlled by yield
>>>controller.send(‘command’)
command
yield,在英文中有“产生、生产、收益“的意思,Python中的yield,也是说的“产生”,但奇特之处在于,yield能中断函数(同时保存函数的状态),而“产生”出一个中间结果。
设想这样一个情形吧:某个文件,每一行对应一个数据,程序需要依次处理所有这些数据。如果数据不多,我们可以把这些数据读到一个集合中,通过循环来处理,这也是常用的办法;但如果数据太多,一次读到内存中就会导致性能问题,所以我们通常会“分批”读入,或者把处理函数“注入”到读入程序中,但是,这些办法都不够“美观”。
其实,我们仔细想想就会明白,理想的办法应该是像“挤牙膏”那样,从外部每调用一次,“挤”出一行,处理完再“挤”出下一行,再处理,这里说的“挤”,就是yield。
下面这个程序,就可以显示yield的神奇之处。
>>>def byLineReader(filename) :
>>> f = open(filename)
>>> line = f.readline()
>>> while line :
>>> yield line
>>> line = f.readline()
>>> f.close()
>>> yield None
这样,我们如果需要读入文件,逐行处理,只需要这样
>>>reader = byLineReader(somefile)
>>>line = reader.next()
>>>processLine(line)
>>>while line:
>>> line = reader.next()
>>> processLine(line)
许多时候,妥善使用yield,不但能节省空间,还能提高效率(每次生成一个结果,随即处理这个结果,有利于程序之间的协作,xrange比range要快,也是这个原因),只是它有点违背大家长期以来的思维习惯。针对yield,我们不妨记住,它适合处理“在循环(或迭代)中返回一系列结果”的场合,这样会比较容易一些。(举个简单的例子,如果我们需要从Fibonacci数列中,找出前几个“符合某条件”的数字,传统的办法大概是,预先计算数列的前若干个数,再逐一检查,或者将判断条件“插入”数列计算函数,但是如果我们把yield写入Fibonaccis数列的生成函数,就好办多了,这样不但省却了无用功,功能的分隔也做得很好)。
不过,yield还有另一点奇妙之处,除了用来“产生”中间结果,它也可以将客户端(调用方)的信息“传进来”,让客户端逐步“控制”函数。在这里,“传进来”,使用的是send函数。
来看下面这个程序:
>>>def controlByYield():
>>> print “A function controlled by yield”
>>> while True :
>>> command = (yield)
>>> if command :
>>> print command
这个函数,每一步接受一次“命令”:
>>>controller = controlByYield()
>>>controller.next()
A function controlled by yield
>>>controller.send(‘command’)
command