• 技术文章 >Python技术 >Python高级

    一篇文章教你如何使用Python生成器

    silencementsilencement2019-07-16 15:20:03原创2565

    自从 PEP 255 引入生成器以来,它就是 Python 中重要的一部分.

    生成器允许你定义一个有迭代器行为的函数.

    它允许程序猿更快,更简单并且以一个干净的方式创建一个迭代器.

    那么什么是迭代器呢,你或许会问?

    iterator 迭代器是一个可以被迭代的(循环)对象。它可以抽象为一个装着数据同时有着可迭代对象的行为的容器。或许你已经每天在使用一些可迭代的对象:诸如字符串,列表,字典或其它名字的对象.

    一个迭代器是一个实现了迭代器接口 Iterator Protocol 的类。这个接口为类提供了两个方法: __iter__ 和 __next__.

    嗯~回到上一步。你为什么想要创建一个迭代器呢?

    节省内存空间

    当实例化后,迭代器并不会计算它每一个项的值,他们只会等你访问这些项的时候采取计算。这也就是众所周知的惰性求值。

    当你有一个非常大的数据集需要计算时,惰性求值是很有用处的。它允许你马上就能开始使用数据,尽管整个数据集还在计算中。

    假设我们想要获得小于某个值的所有素数。

    我们先定义一个函数,它可以检查一个数字是否为素数:

    def check_prime(number):
        for divisor in range(2, int(number ** 0.5) + 1):
            if number % divisor == 0:
                return False
        return True

    然后,我们定义一个迭代器类,包含__iter__ 和 __next__ 方法。

    class Primes:
        def __init__(self, max):
            self.max = max
            self.number = 1
        def __iter__(self):
            return self
        def __next__(self):
            self.number += 1
            if self.number >= self.max:
                raise StopIteration
            elif check_prime(self.number):
                return self.number
            else:
                return self.__next__()

    Primes 类通过给定一个值来实例化。如果下一个素数比值 max 还要大,迭代器就会抛出一个 StopIteration 异常来把迭代器停掉。

    当我们请求迭代器中的下一个元素时,它会给 number 加 1 并检查这个数字是否为素数。如果不是,它会再次调用__next__直到 number 成为素数。一旦如此,迭代器就将这个数字返回。

    通过使用迭代器,我们并不会在内存中创建一个包含很多素数的列表。相反,我们将会在每次请求下一个素数时才去生成它。

    让我们来试一试:

    primes = Primes(100000000000)
    print(primes)
    for x in primes:
        print(x)
        ......
    <__main__.Primes object at 0x1021834a8>
    2
    3
    5
    7
    11
    ...

    对 Primes 对象的每一次迭代都调用了 __next__ 来生成下一个素数。

    迭代器只可以被迭代一轮。如果你尝试再迭代 primes 一轮,它将不会返回任何值,表现得就像个空列表。

    既然我们已经知道了什么是迭代器,以及怎么制作一个迭代器,我们接下来将继续来看看生成器。

    生成器

    回想下,生成器函数允许我们以一种更简单的方式来创建迭代器。

    生成器给 Python 引入了 yield 声明。它用起来有点像 return,因为它会返回一个值。

    区别在于 yield 会保存函数的状态。在函数下一次被调用时,将会从其离开的地方继续执行,并且变量值也与它之前执行 yield 操作前相同。

    如果把我们的 Primes 迭代器转换为生成器,它看起来会像这样:

    def Primes(max):
        number = 1
        while number < max:
            number += 1
            if check_prime(number):
                yield number
    primes = Primes(100000000000)
    print(primes)
    for x in primes:
        print(x)
    ......
    <generator object Primes at 0x10214de08>
    2
    3
    5
    7
    11

    现在真是太 pythonic 了!我们还能再给力点吗?

    当然!我们可以使用 PEP 289 中介绍的生成器表达式。

    这相当于是生成器的列表推导式。它用起来与列表推导式相同,不过表达式由 () 包裹而不是 []。

    下面的表达式可以代替我们上面的生成器函数:

    primes = (i for i in range(2, 100000000000) if check_prime(i))
    print(primes)
    for x in primes:
        print(x)
    ......
    <generator object <genexpr> at 0x101868e08>
    2
    3
    5
    7
    11
    ...

    这就是 Python 生成器的美妙之处。

    总结

    生成器允许你以一种非常 pythonic 的方式来创建迭代器。迭代器允许惰性求值,只有在请求下一个元素时迭代器对象才会去生成它。这对于非常大的数据集是很有用的。迭代器和生成器都只能被迭代一轮。生成器函数比迭代器更好。生成器表达式比迭代器更好(只在简单情况下如此)。

    专题推荐:生成器
    上一篇:Python的高级特性:容易忽略的不可变类型 下一篇:初学者必看的Python模块讲解

    相关文章推荐

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网