利用迭代器,我们可以在每次迭代获取数据(通过next()方法
)时按照特定的规律进行生成。但是我们在实现一个迭代器时,关于当前迭代到的状态需要我们自己记录,进而才能根据当前状态生成下一个数据。为了达到记录当前状态,并配合next()
函数进行迭代使用,我们可以采用更简便的语法,即生成器(generator
)。生成器是一类特殊的迭代器。下面就让我们一起来看看创建生成器的两种方法。
创建生成器方法1
要创建一个生成器,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]
改成()
1 | In [15]: L = [ x*2 for x in range(5)] |
创建L和G的区别仅在于最外层的[]和(),L是一个列表,而G是一个生成器。我们可以直接打印出列表L的每一个元素,而对于生成器G,我们可以按照迭代器的使用方法来使用,即可以通过next()函数、for循环、list()等方法使用。
1 | In [19]: next(G) |
1 | In [26]: G = ( x*2 for x in range(5)) |
创建生成器方法2
generator
非常强大。如果推算的算法比较复杂,用类似列表生成式的for
循环无法实现的时候,还可以用函数来实现。
我们仍然用上篇博文提到的斐波那契数列来举例,回想我们在上一节用迭代器的实现方式:
1 | class FibIterator(object): |
注意,在用迭代器实现的方式中,我们要借助几个变量(n、current、num1、num2
)来保存迭代的状态。现在我们用生成器来实现一下。
1 | In [30]: def fib(n): |
在使用生成器实现的方式中,我们将原本在迭代器__next__
方法中实现的基本逻辑放到一个函数中来实现,但是将每次迭代返回数值的return
换成了yield
,此时新定义的函数便不再是函数,而是一个生成器了。简单来说:只要在def
中有yield
关键字的就称为生成器
此时按照调用函数的方式(案例中为F=fib(5))使用生成器就不再是执行函数体了,而是会返回一个生成器对象(案例中为F),然后就可以按照使用迭代器的方式来使用生成器了
1 | In [38]: for n in fib(5): |
但是用for
循环调用generator
时,发现拿不到generator
的return
语句的返回值。如果想要拿到返回值,必须捕获StopIteration
错误,返回值包含在StopIteration
的value
中:
1 | In [39]: g = fib(5) |
总结
- 使用了
yield
关键字的函数不再是函数,而是生成器。(使用了yield的函数就是生成器) yield
关键字有两点作用:- 保存当前运行状态(断点),然后暂停执行,即将生成器(函数)挂起
- 将
yield
关键字后面表达式的值作为返回值返回,此时可以理解为起到了return
的作用
- 可以使用
next()
函数让生成器从断点处继续执行,即唤醒生成器(函数) Python3
中的生成器可以使用return
返回最终运行的返回值,而Python2
中的生成器不允许使用return
返回一个返回值(即可以使用return从生成器中退出,但return后不能有任何表达式)