浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

2025-04-15 20:52:37

1.iterable iterator区别

要了解两者区别，先要了解一下迭代器协议：
迭代器协议是指：对象需要提供__next__()方法，它返回迭代中的元素，在没有更多元素后，抛出StopIteration异常，终止迭代。
可迭代对象就是：实现了迭代器协议的对象。
协议是一种约定，可迭代对象实现迭代器协议，Python的内置工具(如for循环，sum，min，max函数等)通过迭代器协议访问对象,因此，for循环并不需要知道对象具体是什么，只需要知道对象能够实现迭代器协议即可。
迭代器(iterator)与可迭代对象(iterable)并不是同一个概念。

直观上：

1.可迭代对象(iterable):凡是具有__iter__的方法的类，都是可迭代的类。可迭代类创建的对象实现了__iter__方法，因此就是可迭代对象。用list、tuple等容器创建的对象，都是可迭代对象。可迭代对象通过__iter__方法返回一个迭代器，然后在内部调用__next__方法进行迭代，最后没有元素时，抛出异常(这个异常python自己会处理，不会让开发者看见)。

2.迭代器(iterator):迭代器对象必须同时实现__iter__和__next__方法才是迭代器。对于迭代器来说，__iter__ 返回的是它自身 self，__next__ 则是返回迭代器中的下一个值,最后没有元素时，抛出异常(异常可以被开发者看到)。

从上面2点可以看出：

1.迭代器一定是可迭代对象，因为它实现了__iter__()方法；

2.通过iter()方法(在类的内部就是__iter__)能够使一个可迭代对象返回一个迭代器。

3.迭代器的 __iter__ 方法返回的是自身，并不产生新的迭代器对象。而可迭代对象的 __iter__ 方法通常会返回一个新的迭代器对象。

第3点性质正是可迭代对象可以重复遍历的原因(每次返回一个独立的迭代器，就可以保证不同的迭代过程不会互相影响)；而迭代器由于返回自身，因此只能遍历一次。

上面3点可以通过下面的例子看出来：

from collections import Iterable
from collections import Iterator
print isinstance(iter([1,2]),Iterator)
print isinstance(iter([1,2]),Iterable)
print isinstance([1,2],Iterator)
print isinstance([1,2],Iterable)
##result
True
True
False
True
##id可以查看一个对象在内存中的地址
test=[1,2,3]
testIter=iter(test)
print id(testIter)
print id(testIter)
print id(iter(test))
print id(iter(test))
print id(test.__iter__())
print id(test.__iter__())
##result:可迭代对象每次调用iter方法都会返回一个新的迭代器对象，而迭代器对象调用iter方法返回自身
67162576
67162576
67162688
67162632
67162856
67163024

2.iterable的工作机制

拿一个例子看看，首先定义一个有__iter__方法,但是没有next()方法的类 (PS：在python2中是next()，python3是__next__())：

from collections import Iterable, Iterator
class Student(object):
 def __init__(self,score):
 self.score=score
 def __iter__(self):
 return iter(self.score)

test= Student([80,90,95])
print isinstance(test, Iterable)
print isinstance(test, Iterator)
for i in test:
 print i
##result
True
False
80
90
95
##可重复遍历
for i in test:
 print i
##result
80
90
95

上面代码的结果印证了定义中提到的：

缺少了next()方法，可迭代对象就不是迭代器。

此外，注意到：可迭代对象通过__iter__方法每次都返回了一个独立的迭代器，这样就可以保证不同的迭代过程不会互相影响。

也就是说，通过iterable可以实现重复遍历，而迭代器是无法重复遍历的！

因此，如果想要把可迭代对象转变为迭代器，可以先调用iter()方法返回一个迭代器。然后就可以用next()不断迭代了！

print isinstance(iter(test),Iterator)
testIter=iter(test)
print testIter.next()
print testIter.next()
print testIter.next()
##result
True
80
90
95
##一旦取完了可迭代对象中所有的元素，再次调用next就会发生异常
print testIter.next()
##result
StopIteration:

3.迭代器Iterator的工作机制

看下面这个例子：

class Student(object):
 def __init__(self,score):
 self.score=score
 def __iter__(self):
 return self

 def next(self):
 if self.score<100:
 self.score+=1
 return self.score
 else:
 raise StopIteration()

test= Student(90)
print isinstance(test, Iterable)
print isinstance(test, Iterator)
print test.next()
print test.next()
print test.next()
for i in test:
 print i
##result
True
True
91
92
93
94
95
96
97
98
99
100
##如果此时再对test这个迭代器调用next方法，就会抛出异常
test.next()
##result
StopIteration:

这个例子印证了定义中的：迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么，使用迭代器好处在哪呢?

Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

一个很常见的应用就是：Python在处理列表的时候，是直接把整个列表读进内存的，当遇到大量样本时的时候会变得很慢。而迭代器的优势在于只把需要的元素读进内存，因此占用内存更少。

换句话说，迭代器是一种惰性求值模式，它是有状态的，只有在调用时才返回值，没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

这个例子印证了定义中的：迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么，使用迭代器好处在哪呢?

换句话说，迭代器是一种惰性求值模式，它是有状态的，只有在调用时才返回值，没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

4.for循环的工作机制

有了上面2个例子，就可以总结一下在可迭代对象与迭代器中的For循环工作机制了。

当对象本身就是迭代器时，For循环工作机制：

调用 __iter__方法，返回自身self,也就是返回迭代器。
不断地调用迭代器的next()方法，每次按序返回迭代器中的一个值。
迭代到最后没有元素时，就抛出异常 StopIteration

在可迭代对象中，for循环工作机制：

先判断对象是否为可迭代对象(等价于判断有没有__iter__或__getitem__方法)，没有的话直接报错，抛出TypeError异常。有的话，调用 __iter__方法，返回一个迭代器。
在python内部不断地调用迭代器的__next__方法，每次按序返回迭代器中的一个值。
迭代到最后没有元素时，就抛出异常 StopIteration，这个异常 python 自己会处理，不会暴露给开发者。

借用网络上的一张图直观理解一下：

此外，还要注意，python中的for循环其实兼容了两种机制：

如果对象有__iter__会返回一个迭代器。
如果对象没有__iter__，但是实现了__getitem__，会改用下标迭代的方式。
__getitem__可以帮助一个对象进行取数和切片操作。

当for发现没有__iter__但是有__getitem__的时候，会从0开始依次读取相应的下标，直到发生IndexError为止，这是一种旧的迭代协议。iter方法也会处理这种情况，在不存在__iter__的时候，返回一个下标迭代的iterator对象来代替。一个重要的例子是str，字符串就是没有__iter__方法的，但是却依然可以迭代，原因就是其在for循环时调用了__getitem__方法。

看一个例子：

from collections import Iterable, Iterator
class Student(object):
 def __init__(self,score):
 self.score=score
 def __getitem__(self,n):
 return self.score[n]

test= Student([80,90,95])
print isinstance(test, Iterable)
print isinstance(test, Iterator)
print isinstance(iter(test), Iterable)
print isinstance(iter(test), Iterator)
for i in test:
 print i
##result
False
False
True
True
80
90
95
for i in range(0,3):
 print test[i]
##result
80
90
95
for i in iter(test):
 print i
##result
80
90
95

可以看到，实现了__getitem__方法的对象本身，尽管不是iterable与iterator，仍旧是可以调用for循环的。
通过iter方法，返回一个下标迭代的iterator对象。

5.generator的原理

最后说一下生成器，生成器是一种特殊的迭代器，当然也是可迭代对象。
对于生成器，Python会自动实现迭代器协议，以便应用到迭代中（如for循环，sum函数）。由于生成器自动实现了迭代器协议，所以，我们可以调用它的next方法，并且，在没有值可以返回的时候，生成器自动产生StopIteration异常。
创建生成器的方法：将return 改为yield。具体的实现网络上教程很多，不细说了。

6.总结

到一幅图片很好的描述了本文的所有内容，就拿它作为文末的总结吧！

以上所述是小编给大家介绍的Python中的可迭代对象、迭代器、For循环工作机制、生成器详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们网站的支持！

python中的迭代和可迭代对象代码示例

什么是迭代(iteration)呢? 给定一个list或者tuple,通过for循环来遍历这个list或者tuple.这种遍历就是迭代(iteration).只要是可迭代的对象都可以进行迭代.怎么判断一个对象是否是可迭代的对象呢?可以用collections模块里面的iterable包的isinstance函数进行判断: >>> from collections import Iterable#载入模块 >>> isinstance('abc',Iterable) #字
python生成器，可迭代对象，迭代器区别和联系

生成器,可迭代对象,迭代器之间究竟是什么关系? 用一幅图来概括: 1.生成器定义生成器方式一: //区别于列表生成式 gen = [x*x for x in range(5)] gen = (x*x for x in range(5)) print(gen) //Out:<generator object <genexpr> at 0x00000258DC5CD8E0> 方式二: def fib(): prev, curr = 0, 1 while True: yield cu
Python cookbook（数据结构与算法）从任意长度的可迭代对象中分解元素操作示例

本文实例讲述了python从任意长度的可迭代对象中分解元素操作.分享给大家供大家参考,具体如下: 从某个可迭代对象中分解出N个元素,但是可迭代对象的长度可能超过N,会出现"分解值过多"的异常: 使用"*表达式"来解决该问题: Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit (Intel)] on win32 Type "copyright",
python使用生成器实现可迭代对象

本文实例为大家分享了python使用生成器实现可迭代对象的具体代码,供大家参考,具体内容如下案例分析: 实一个可迭代对象的类,它能迭代出给定范围内所有的素数: pn = Number(1, 30) for k in pn: print(k) 结果为:2,3,5,7,11,13,17,19,23,29 如何解决这个问题? 将该类的__iter__方法实现成生成器函数,每次yield返回一个素数 #!/usr/bin/python3 class Number(object): def __init
浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

1.iterable iterator区别要了解两者区别,先要了解一下迭代器协议: 迭代器协议是指:对象需要提供__next__()方法,它返回迭代中的元素,在没有更多元素后,抛出StopIteration异常,终止迭代. 可迭代对象就是:实现了迭代器协议的对象. 协议是一种约定,可迭代对象实现迭代器协议,Python的内置工具(如for循环,sum,min,max函数等)通过迭代器协议访问对象,因此,for循环并不需要知道对象具体是什么,只需要知道对象能够实现迭代器协议即可. 迭代器(ite
浅谈Python中的可变对象和不可变对象

什么是可变/不可变对象不可变对象,该对象所指向的内存中的值不能被改变.当改变某个变量时候,由于其所指的值不能被改变,相当于把原来的值复制一份后再改变,这会开辟一个新的地址,变量再指向这个新的地址. 可变对象,该对象所指向的内存中的值可以被改变.变量(准确的说是引用)改变后,实际上是其所指的值直接发生改变,并没有发生复制行为,也没有开辟新的出地址,通俗点说就是原地改变. Python中,数值类型(int和float).字符串str.元组tuple都是不可变类型.而列表list.字典dict.集合
浅谈python中str字符串和unicode对象字符串的拼接问题

str字符串 s = '中文' # s: <type 'str'> s是个str对象,中文字符串.存储方式是字节码.字节码是怎么存的: 如果这行代码在python解释器中输入&运行,那么s的格式就是解释器的编码格式: 如果这行代码是在源码文件中写入.保存然后执行,那么解释器载入代码时就将s初始化为文件指定编码(比如py文件开头那行的utf-8): unicode对象字符串 unicode是一种编码标准,具体的实现可能是utf-8,utf-16,gbk等等,这就是中文字符串和unicod
浅谈Python中的常用内置对象

一.常用的python内置对象对象类型类型名称示例简要说明数字 int,float,complex 1234,3.14,3+4j 数字大小没有限制,内置支持复数及其运算字符串 str 'swfu' 使用单引号.双引号.三引号作为定界符,以r/R引导表示原始字符串字节串 bytes b'hello world' 以字母b引导,可以使用单引号.双引号.三引号作为定界符列表 list [1,2,3] 所有元素放在[ ]中,元素之向使用","分隔,其中的元素可以是任意类型字典
浅谈python中的数字类型与处理工具

python中的数字类型工具 python中为更高级的工作提供很多高级数字编程支持和对象,其中数字类型的完整工具包括: 1.整数与浮点型, 2.复数, 3.固定精度十进制数, 4.有理分数, 5.集合, 6.布尔类型 7.无穷的整数精度 8.各种数字内置函数及模块. 基本数字类型 python中提供了两种基本类型:整数(正整数金额负整数)和浮点数(注:带有小数部分的数字),其中python中我们可以使用多种进制的整数.并且整数可以用有无穷精度. 整数的表现形式以十进制数字字符串写法出现,浮点数带
浅谈python中统计计数的几种方法和Counter详解

1) 使用字典dict() 循环遍历出一个可迭代对象中的元素,如果字典没有该元素,那么就让该元素作为字典的键,并将该键赋值为1,如果存在就将该元素对应的值加1. lists = ['a','a','b',5,6,7,5] count_dict = dict() for item in lists: if item in count_dict: count_dict[item] += 1 else: count_dict[item] = 1 2) 使用defaultdict() defaultdi
浅谈Python中的生成器和迭代器

迭代器迭代器协议对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么返回一个异常来终止本次迭代.(只能往前走,不能往后退!) 迭代器对象遵循了(实现了)迭代器协议的对象.(对象内部实现了一个__next__方法,以实现迭代器协议)称为一个迭代器对象.他们的作用是逐个遍历容器中的对象.迭代器对象一定是可迭代对象 >>> from collections import Iterable, Iterator >>> l = list([1,2,3]) #
浅谈python中copy和deepcopy中的区别

在下是个编程爱好者,最近将魔爪伸向了Python编程.....遇到copy和deepcopy感到很困惑,现在针对这两个方法进行区分,一种是浅复制(copy),一种是深度复制(deepcopy). 首先说一下deepcopy,所谓的深度复制,在这里我理解的是完全复制然后变成一个新的对象,复制的对象和被复制的对象没有任何关系,彼此之间无论怎么改变都相互不影响. 然后说一下copy,在这里我分为两类来说,一种是字典数据类型的copy函数,一种是copy包的copy函数. 一.字典数据类型的copy函数
浅谈python中的面向对象和类的基本语法

当我发现要写python的面向对象的时候,我是踌躇满面,坐立不安呀.我一直在想:这个坑应该怎么爬?因为python中关于面向对象的内容很多,如果要讲透,最好是用面向对象的思想重新学一遍前面的内容.这个坑是如此之大,犹豫再三,还是只捡一下重要的内容来讲吧,不足的内容只能靠大家自己去补充了. 惯例声明一下,我使用的版本是 python2.7,版本之间可能存在差异. 好,在开讲之前,我们先思考一个问题,看代码: 为什么我只创建是为 a 赋值,就可以使用一些我没写过的方法? 可能会有小伙伴说:因为 a
浅谈python中的getattr函数 hasattr函数

hasattr(object, name) 作用:判断对象object是否包含名为name的特性(hasattr是通过调用getattr(ojbect, name)是否抛出异常来实现的). 示例: >>> hasattr(list, 'append') True >>> hasattr(list, 'add') False getattr(object,name,default): 作用:返回object的名称为name的属性的属性值,如果属性name存在,则直接返回其

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

相关推荐

随机推荐