Python函数式编程中itertools模块详解

2025-04-01 13:02:52

容器与可迭代对象

在正式开始前先补充一些基本概念在 Python 中存在容器与可迭代对象

容器：用来存储多个元素的数据结构，例如列表，元组，字典，集合等内容；
可迭代对象：实现了 __iter__ 方法的对象就叫做可迭代对象。

从可迭代对象中还衍生出迭代器与生成器：

迭代器：既实现了 __iter__，也实现了 __next__ 方法的对象叫做迭代器；
生成器：具有 yield 关键字的函数都是生成器。

这样就比较清楚了，可迭代对象的范围要大于容器。而且可迭代对象只能使用一次，使用完毕再获取值就会提示 StopIteration 异常。

除此之外，可迭代对象还有一些限制：

不能对可迭代对象使用 len 函数；
可以使用 next 方法处理可迭代对象，容器也可以通过 iter 函数转换成迭代器；
for 语句会自动调用容器的 iter 函数，所以容器也能被循环迭代。

count() 函数

count 函数一般与 range 函数对比学习，例如 range 函数需要定义生成范围的下限，上限与步长可选，而 count 函数不同，指定下限与步长，上限值不用声明。

函数原型声明如下

count(start=0, step=1) --> count object

测试代码如下，其中必须添加跳出循环的判定条件，否则代码会一直运行下去。

from itertools import count
a = count(5, 10)
for i in a:
    print(i)
    if i > 100:
        break

除此之外，count 函数还接收非整数参数，所以下述代码中定义的也是正确的。

from itertools import count
a = count(0.5, 0.1)
for i in a:
    print(i)
    if i > 100:
        break

cycle 函数

用 cycle 函数可以循环一组值，测试代码如下所示：

from itertools import cycle
x = cycle('梦想橡皮擦abcdf')
for i in range(5):
    print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
    print(next(x), end=" ")

代码输出如下内容：

梦想橡皮擦

****************************************************************************************************
a b c d f

可以看到 cycle 函数与 for 循环非常类似。

repeat 函数

repeat 函数用于重复返回某个值，官方给出的函数描述如下所示：

class repeat(object):
    """
    repeat(object [,times]) -> create an iterator which returns the object
    for the specified number of times.  If not specified, returns the object
    endlessly.

进行一下简单的测试，看一下效果：

from itertools import repeat
x = repeat('橡皮擦')
for i in range(5):
    print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
    print(next(x), end=" ")

怎么看这个函数，都好像没有太大用处。

enumerate 函数，添加序号

这个函数在前面的文章中，已经进行过简单介绍，并且该函数在 __builtins__ 包中，所以不再过多说明，基本格式如下所示：

enumerate(sequence, [start=0])

其中 start 参数是下标起始位置。

accumulate 函数

该函数基于给定的函数返回一个可迭代对象，默认是累加效果，即第二个参数为 operator.add，测试代码如下：

from itertools import accumulate
data = [1, 2, 3, 4, 5]
# 计算累积和
print(list(accumulate(data)))  # [1, 3, 6, 10, 15]

针对上述代码，修改为累积。

from itertools import accumulate
import operator
data = [1, 2, 3, 4, 5]
# 计算累积
print(list(accumulate(data, operator.mul)))

除此之外，第二个参数还可以为 max，min 等函数，例如下述代码：

from itertools import accumulate
data = [1, 4, 3, 2, 5]
print(list(accumulate(data, max)))

代码输出如下内容，其实是将 data 里面的任意两个值进行了比较，然后留下最大的值。

[1, 4, 4, 4, 5]

chain 与 groupby 函数

chain 函数用于将多个迭代器组合为单个迭代器，而 groupby 可以将一个迭代器且分为多个子迭代器。

首先展示一下 groupby 函数的应用：

from itertools import groupby
a = list(groupby('橡橡皮皮擦擦'))
print(a)

输出内容如下所示：

[('橡', <itertools._grouper object at 0x0000000001DD9438>),
('皮', <itertools._grouper object at 0x0000000001DD9278>),
('擦', <itertools._grouper object at 0x00000000021FF710>)]

为了使用 groupby 函数，建议先对原列表进行排序，因为它是有点像切片一样，发现不同的就分出一个迭代器。

chain 函数的用法如下，将多个迭代对象进行拼接：

from itertools import groupby, chain
a = list(chain('ABC', 'AAA', range(1,3)))
print(a)

zip_longest 与 zip

zip 函数在之前的博客中已经进行过说明，zip_longest 与 zip 的区别就是，zip 返回的结果以最短的序列为准，而 zip_longest 以最长的为准。

测试代码如下，自行比对结果即可。

from itertools import zip_longest
a = list(zip('ABC', range(5), [10, 20, 30, 40]))
print(a)
a = list(zip_longest('ABC', range(5), [10, 20, 30, 40]))
print(a)

zip_logest 如果碰到长度不一致的序列，缺少部分会填充 None。

tee 函数

tee 函数可以克隆可迭代对象，产出多个生成器，每个生成器都可以产出输入的各个元素。

from itertools import tee
a = list(tee('橡皮擦'))
print(a)

compress 函数

该函数通过**谓词（是否，True/False）**来确定对某个元素的取舍问题，最简单的代码如下所示：

from itertools import compress
a = list(compress('橡皮擦', (0, 1, 1)))
print(a)

islice、dropwhile、takewhile、filterfalse、filter

这几个函数都是从输入的可迭代对象中获取一个子集，而且不修改元素本身。

本部分只罗列各个函数的原型声明，具体用法直接参考使用即可。

islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
dropwhile(predicate, iterable) --> dropwhile object
takewhile(predicate, iterable) --> takewhile object
filterfalse(function or None, sequence) --> filterfalse object

其中只有 filterfalse 中的参数是函数在前，序列在后。

测试代码如下，尤其注意第一个参数是 callable 即函数。

from itertools import islice, dropwhile, takewhile, filterfalse
a = list(filterfalse(lambda x: x in ["皮", "擦"], '橡皮擦'))
print(a)

总结

以上内容就是本文的全部内容，在使用无限迭代器函数 count，cycle，repeat 的时候，一定要注意即使停止。

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注我们的更多内容！

关于Python中循环器 itertools的介绍

目录 1.无穷循环器 2.函数式工具 3.组合工具 4.groupby() 5.其它工具在for i in iterator结构中,循环器每次返回的对象将赋予给i,直到循环结束.使用iter()内置函数,我们可以将诸如表.字典等容器变为循环器.比如 for i in iter([2, 4, 5, 6]): print(i) 标准库中的itertools包提供了更加灵活的生成循环器的工具.这些工具的输入大都是已有的循环器.另一方面,这些工具完全可以自行使用Python实现,该包只是提供了一种比较
python中的itertools的使用详解

今天了解了下python中内置模块itertools的使用,熟悉下,看能不能以后少写几个for,嘿嘿
Python itertools.product方法代码实例

itertools.product:类似于求多个可迭代对象的笛卡尔积. 使用的形式是: itertools.product(*iterables, repeat=1), product(X, repeat=3)等价于product(X, X, X). 1. 直接使用时:分别生成元组,然后合成一个list import itertools aa = itertools.product(['西藏','瀑布','湖水'], ['月色','星空']) bb = list(aa) #按照顺序生成笛卡尔积,
Python中itertools的用法详解

iterator 循环器(iterator)是对象的容器,包含有多个对象.通过调用循环器的next()方法 (next()方法,在Python 3.x中),循环器将依次返回一个对象.直到所有的对象遍历穷尽,循环器将举出StopIteration错误. 在for i in iterator结构中,循环器每次返回的对象将赋予给i,直到循环结束.使用iter()内置函数,我们可以将诸如表.字典等容器变为循环器.比如 for i in iter([2, 4, 5, 6]): print i 标准库中的i
Python itertools模块详解

这货很强大, 必须掌握文档链接 http://docs.python.org/2/library/itertools.html pymotw 链接 http://pymotw.com/2/itertools/ 基本是基于文档的翻译和补充,相当于翻译了 itertools用于高效循环的迭代函数集合组成总体,整体了解无限迭代器复制代码代码如下: 迭代器参数结果
介绍Python中内置的itertools模块

Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数. 首先,我们看看itertools提供的几个"无限"迭代器: >>> import itertools >>> natuals = itertools.count(1) >>> for n in natuals: ... print n ... 1 2 3 ... 因为count()会创建一个无限的迭代器,所以上述代码会打印出自然数序列,根本停不下来,只
Python函数式编程中itertools模块详解

目录容器与可迭代对象 count() 函数 cycle 函数 repeat 函数 enumerate 函数,添加序号 accumulate 函数 chain 与 groupby 函数 zip_longest 与 zip tee 函数 compress 函数 islice.dropwhile.takewhile.filterfalse.filter 总结容器与可迭代对象在正式开始前先补充一些基本概念在 Python 中存在容器与可迭代对象容器:用来存储多个元素的数据结构,例如列表,元
python中random模块详解

Python中的random模块用于生成随机数,它提供了很多函数.常用函数总结如下: 1. random.random() 用于生成一个0到1的随机浮点数: 0 <= n < 1.0 2. random.seed(n) 用于设定种子值,其中的n可以是任意数字.random.random() 生成随机数时,每一次生成的数都是随机的.但是,使用 random.seed(n) 设定好种子之后,在先调用seed(n)时,使用 random() 生成的随机数将会是同一个. 3. random.unifo
Python中BeautifulSoup模块详解

目录前言安装库导入库解析文档示例提取数据示例 CSS选择器实例小项目总结前言 BeautifulSoup是主要以解析web网页的Python模块,它会提供一些强大的解释器,以解析网页,然后提供一些函数,从页面中提取所需要的数据,目前是Python爬虫中最常用的模块之一. 安装库在使用前需要安装库,这里建议安装bs4,也就是第四版本,因为根据官方文档第三版的已经停止更新.同时安装lxml解释器 pip3 install bs4 pip3 install lxml 导入库 from
Python常用内置模块之xml模块(详解)

xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言.从结构上,很像HTML超文本标记语言.但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观.它被设计用来传输和存储数据,其焦点是数据的内容.那么Python是如何处理XML语言文件的呢?下面一起来看看Python常用内置模块之xml模块吧. 本文主要学习的ElementTree是python的XML处理模块,它提供了一个轻量级的对象模型.在使用ElementTre
Python自动重新加载模块详解(autoreload module)

守护进程模式使用python开发后台服务程序的时候,每次修改代码之后都需要重启服务才能生效比较麻烦. 看了一下Python开源的Web框架(Django.Flask等)都有自己的自动加载模块功能(autoreload.py),都是通过subprocess模式创建子进程,主进程作为守护进程,子进程中一个线程负责检测文件是否发生变化,如果发生变化则退出,主进程检查子进程的退出码(exist code)如果与约定的退出码一致,则重新启动一个子进程继续工作. 自动重新加载模块代码如下: autorel
Python多线程编程之threading模块详解

一.介绍线程是什么?线程有啥用?线程和进程的区别是什么? 线程是操作系统能够进行运算调度的最小单位.被包含在进程中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务. 二.Python如何创建线程 2.1 方法一: 创建Thread对象步骤: 1.目标函数 2.实例化Thread对象 3.调用start()方法 import threading # 目标函数1 def fun1(num): for i in range(
Python面向对象编程repr方法示例详解

目录为什么要讲 __repr__ 重写 __repr__ 方法 str() 和 repr() 的区别为什么要讲 __repr__ 在 Python 中,直接 print 一个实例对象,默认是输出这个对象由哪个类创建的对象,以及在内存中的地址(十六进制表示) 假设在开发调试过程中,希望使用 print 实例对象时,输出自定义内容,就可以用 __repr__ 方法了或者通过 repr() 调用对象也会返回 __repr__ 方法返回的值是不是似曾相识....没错..和 __str__ 一样的
Python学习之包与模块详解

目录什么是 Python 的包与模块包的身份证如何创建包创建包的小练习包的导入 - import 模块的导入 - from…import 导入子包及子包函数的调用导入主包及主包的函数调用导入的包与子包模块之间过长如何优化强大的第三方包什么是第三方包如何安装第三方包总结大家好,学完面向对象与异常处理机制之后,接下里我们要学习包与模块 .首先我们要了解什么是包?什么是模块?接下来我们还要学习如何自定义创建包.自定义创建模块以及如何导入包与模块.最后我们在学习如何使用第三方
Python pandas库中的isnull()详解

问题描述 python的pandas库中有一个十分便利的isnull()函数,它可以用来判断缺失值,我们通过几个例子学习它的使用方法. 首先我们创建一个dataframe,其中有一些数据为缺失值. import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(10,99,size=(10,5))) df.iloc[4:6,0] = np.nan df.iloc[5:7,2] = np.nan df.iloc[
Python装饰器中@property使用详解

目录最初的声明方式使用装饰器的声明方式使用装饰器的调用过程总结最初的声明方式在没有@property修饰的情况下,需要分别声明get.set.delete函数,然后初始化property类,将这些方法加载进property中 class C持有property的实例化对象x 对外表现出来C().x时,实际上是调用C()中的x(property类)中设置的fset,fget,fdel,分别对应getx,setx,delx C真正持有的x,是self._x被隐藏起来了 class C(o