Python —— 生成器与yield yield与生成器的使用


一、什么是生成器

  生成器是一种特殊的迭代器。他也是一个可迭代对象。它主要有以下几个特点:

  1. 生成器作为一个可迭代对象,可以像列表一样用for语句循环调用取值。[1.1]
  2. 虽然可以用for循环取值,但是只能取一次,无法像列表一样重复使用。[1.2]
  3. 生成器数据无法像列表一样直接任意调用某一项数据,例如:一个长度为10的List列表我可以直接调用a = List[7]来赋值,但生成器只能用for语句逐项取用。[1.3]

1.1 生成器,使用for语句

  举例:

list_test = [i for i in range(5)]
print('列表输出')
for j in list_test:
 print(j)
print('**********')
generator_test = (i for i in range(5))
print('生成器输出')
for j in generator_test:
 print(j)

  输出:

列表输出
0
1
2
3
4
**********
生成器输出
0
1
2
3
4

  输出的结果都是一样的。

1.2 生成器,所有项只能取一次

  举例:

generator_test = (i for i in range(5))
print('生成器第一次输出')
for j in generator_test:
 print(j)
print('生成器第二次输出')
for j in generator_test:
 print(j)

  输出:

生成器第一次输出
0
1
2
3
4
生成器第二次输出

  第二次输出是没有值的,因为生成器的数据只能取用一次。

1.3 生成器,无法任意取其中一项数据

  示例:

list_test = [i for i in range(5)]
print('列表可以取第二项')
print(list_test[1])
print('**********')
generator_test = (i for i in range(5))
print('生成器直接取第二项会报错')
print(generator_test[1])

  输出:

列表可以取第二项
1
**********
生成器直接取第二项会报错
Traceback (most recent call last):
 File "C:\Users\Ju_Long\Desktop\Python\example.py", line 10, in 
 print(generator_test[1])
TypeError: 'generator' object is not subscriptable

  无法直接取用数值

1.2 为什么要使用生成器

  从1.3章节可以看出,生成器产生的数据不是一次性全部生成出来,而是使用一个,再生成一个,可以节约大量的内存。有兴趣的可以尝试一下下面代码的区别:

import time
start_time = time.time()
list_test = [i for i in range(10000000)]
stop_time = time.time()
print('Consumption of time for creating a list: {}'.format(stop_time - start_time))
start_time = time.time()
generator_test = (i for i in range(10000000))
stop_time = time.time()
print('Consumption of time for creating a generator: {}'.format(stop_time - start_time))

  输出:

Consumption of time for creating a list: 0.7739417552947998
Consumption of time for creating a generator: 0.0

  多消耗的这些时间就是为了创建数据并写入内存。可以看出不仅耗时还耗内存。

二、生成器的创建与使用

  创建生成器有以下两种方式:

2.1 推导式列表,创建生成器

  参照章节1.1中的代码,注意区分:创建列表用的是[],创建生成器用的是()

list_test = [i for i in range(5)]
print('列表输出')
for j in list_test:
 print(j)
print('**********')
generator_test = (i for i in range(5))
print('生成器输出')
for j in generator_test:
 print(j)

  输出:

列表输出
0
1
2
3
4
**********
生成器输出
0
1
2
3
4

2.2 用yield关键字,创建生成器

  只要在函数中看到了yield这个关键字那就是生成器,代码示例:

def generator_test(n):
 for i in range(n):
 print(f"开始第{i}次生成...")
 yield i
 print(f"完成第{i}次生成...")
generator_instance = generator_test(5)
return_val_1 = next(generator_instance)
print(f'第一次取值为:{return_val_1}')
print('*' * 10, '\n')
return_val_2 = next(generator_instance)
print(f'第一次取值为:{return_val_2}')
print('*' * 10, '\n')
return_val_3 = next(generator_instance)
print(f'第一次取值为:{return_val_3}')
print('*' * 10, '\n')
return_val_4 = next(generator_instance)
print(f'第一次取值为:{return_val_4}')
print('*' * 10, '\n')
return_val_5 = next(generator_instance)
print(f'第一次取值为:{return_val_5}')
print('*' * 10, '\n')

  输出:

开始第0次生成...
第一次取值为:0
********** 
完成第0次生成...
开始第1次生成...
第一次取值为:1
********** 
完成第1次生成...
开始第2次生成...
第一次取值为:2
********** 
完成第2次生成...
开始第3次生成...
第一次取值为:3
********** 
完成第3次生成...
开始第4次生成...
第一次取值为:4
**********

  上述代码中我们用到了next()来逐项取迭代器(在这里是生成器)的值。我们可以看到当生成器每次运行到yield时都会停止并返回当前的i值(有些类似于IDE软件调试功能的中断,yield相当于在生成器内部打了一个中断标签,每次运行到这里都会停下)并等待下次next()调用。当下次next()调用来临时,我们会继续从上次停下的地方(也就是yield关键词所在)开始运行。

  每次取值的对应关系如下:

  有时我们会有如下疑问:


  后面还有send(msg)的使用,可以参照——参考文献[2]


参考文章

  1. Python中的生成器
作者:julong187原文地址:https://blog.csdn.net/julong187/article/details/136252935

%s 个评论

要回复文章请先登录注册