Python学习之线程池与GIL全局锁详解

2025-03-30 23:41:29

线程池

线程池的创建 - concurrent

concurrent 是 Python 的内置包，使用它可以帮助我们完成创建线程池的任务。

方法名	介绍	示例
futures.ThreadPoolExecutor	创建线程池	tpool=ThreadPoolExecutor(max_workers)

通过调用 concurrent 包的 futures 模块的 ThreadPoolExecutor 类，通过实例化 ThreadPoolExecutor 实现创建线程池的对象，它有一个参数来设置线程池的数量。这和创建进程池设置的数量是完全相同的。

线程池的常用方法

接下里看一下线程池对象中都有哪些常用的方法：

函数名	介绍	用法
submit	往线程池中添加任务	submit(target, args)
done	确认线程池中的某个线程是否完成了任务	done()
rsult	获取当前线程执行任务的结果	result()

submit 函数：通过 submit 函数将参数传入；该函数传入的参数也是传入要执行的函数与该函数的参数，由于它的参数并不用需要通过赋值语句的形式传入，只需要把相应的值传入就可以了（稍后会进行一个练习）。
done 函数：判断当前线程是否执行完成；返回值是 bool 类型。
result 函数：返回当前线程池中线程任务的执行结果，通过这种方法就可以获取线程池的返回值了。

线程池演示案例

1、定义一个函数实现循环的效果

2、定义一个线程池，设置线程的数量

# coding:utf-8

import time
from concurrent.futures import ThreadPoolExecutor

def work(i):
    print('第 {} 次循环'.format(i))
    time.sleep(1)   # 之所以每次都要使用 sleep 函数，是因为函数执行太快；通过 sleep 尝试模拟一下长时间的执行一个任务

if __name__ == '__main__':
    thread_poor = ThreadPoolExecutor(4)	# 实例化一个线程池，设置线程数量为4

    for i in range(20):
        thread_poor.submit(work, (i,))		# 利用 submit 函数将任务添加至 work 函数

运行效果如下

从运行结果来看，我们的线程任务每次执行4个任务，阻塞一秒后再执行后续的四个线程的任务，是没有问题的。

PS：需要注意的是，运行结果有可能是出现将两个或者多个任务的结果在同一行打印输出，这是因为在同一时间处理了多个线程的任务，这也叫 "并发"。

线程锁

前文的进程池是与进程锁相对应匹配的，同样的线程池也有与之对应的线程锁。线程锁的使用方法几乎与进程锁是一样的，只不过线程锁对应的是线程罢了。

1.实例化一个线程锁

2、在 work 函数中调用线程锁

3、并获取线程的返回值(线程池也是可以获取返回值的)

代码示例如下：

 # coding:utf-8

import os
import time
import threading
from concurrent.futures import ThreadPoolExecutor

lock = threading.Lock()     # 全局定义一个 Lock() 实例

def work(i):
    lock.acquire()          # 区别于 进程锁 只需要在全局实例化一个即可，线程锁需要在线程任务的函数中调用 线程锁 才会生效
    print('当前是第 {} 次循环'.format(i))
    time.sleep(1)           # 之所以每次都要使用 sleep 函数，是因为函数执行太快；通过 sleep 尝试模拟一下长时间的执行一个任务
    lock.release()
    return '第 {} 次循环的进程id为：{}'.format(i, os.getpid())    # 线程也是基于进程实现的

if __name__ == '__main__':
    thread_poor = ThreadPoolExecutor(4)    # 实例化一个线程池，设置线程数量为4

    result = []

    for i in range(20):
        result_thread = thread_poor.submit(work, (i,))      # 利用 submit 函数将任务添加至 work 函数；
                                                            # 需要注意的是这里不像进程池那样使用赋值的形式传入 work 函数
        result.append(result_thread)

    for res in result:
        print(res.result())

运行结果如下：

从运行结果可以看到，之前一同执行的4个任务现在变成了一次只执行一个任务；每一个个线程都是在主进程 93215下执行的，说明线程与进程还是有所区别的，虽然我们有多个线程任务在执行，但是依然是在主进程下去完成的；同时我们还获取到了线程的返回值第 {} 次循环的进程id为：{}'.format(i, os.getpid() 。

以上就是线程池的使用和常用方法，我们会发现线程池的使用实际上要比进程池的使用要容易一些。进程池我们需要考虑 join 与 close 等一些问题，但是线程池则不需要那么的严格，并且线程相对于进程要更加的轻量，使用起来也更加的便捷。

利用线程池实现抽奖小案例

案例代码如下：

# coding:utf-8

import threading
import random
from concurrent.futures import ThreadPoolExecutor

lock = threading.Lock()
def luck_draw(arg):
    lock.acquire()
    # 从手机列表中随机选出一个中奖手机，其他手机均未中奖
    phone = random.choice(arg[0])
    # 在从奖池中随机选取一个奖品，视为该手机抽中的奖品
    price = random.choice(arg[1])
    prices.remove(price)
    phones.remove(phone)
    lock.release()
    return '恭喜手机尾号为{}的用户，抽到{}'.format(str(phone)[-5:-1], price)

if __name__ == '__main__':
    t = ThreadPoolExecutor(3)       # 通过创建三个线程从而实现每个线程完成一项抽奖任务
    # 确定抽奖人数
    phone_num = int(input('请输入抽奖的用户人数：'))
    # 模拟产生出相应数量的手机号
    phones = random.sample(range(13300000000, 19999999999), phone_num)      # 这里设置的随机号码仅做演示效果
    prices = ['一等奖：iPhone12 ProMax', '二等奖：ipad2021pro', '三等奖：air wetter']
    result = []
    for i in range(3): # 三个任务，每个线程分配一个
        t_result = t.submit(luck_draw, (phones, prices))
        result.append(t_result)

    for res in result:
        print(res.result())

运行效果如下：

GIL全局锁

本章节的开头我们就说过，该部分没有代码的相关练习。仅仅是对 GIL全局锁做一个概念上的简单启蒙。

其他语言的线程与Python线程的区别

多线程与多进程的使用其实是比较复杂的，目前作为初学者来说涉及的还比较浅。最近的几个章节介绍了进程与线程在CPU的执行方式，这里再进行拓展一下。

下面我们看一张图：

依然是一个CPU 与4个核心（可以认为是4条跑道）；

先看左边的两条跑道，是进程1创建的3个线程。这三条线程有一个去了 1core 跑道，另外两条则去了 2core 跑道。线程之间有选择性的进入了不同的跑道，当然进程1的主进程或者说是主线程可能会在 1core 跑道、也可能会在 2core 跑道，这是其他语言进行多线程的样子。

再来看看右边，Python 创建的进程2。当进程创建之后，包含主线程一共产生了3个线程，而这三个线程都跑到了 4core 跑道上去。它不会像其他语言那样去寻找不同的有空闲资源的跑道去执行，而是仅仅在主进程所处的跑道去执行线程。造成 Python 中的多线程无法在多条跑道执行任务的主要原因就是因为 GIL全局锁，这个 GIL 并不是 Python语法中添加上去的，而是 python解释器在执行的时候自动加了这把 "锁" 。

GIL 的作用

因为 GIL 锁的关系，使得 Python 的多线程无法在多个CPU跑道上去执行任务，它只能在单一CPU上进行工作。

这也限制了多线程的性能，毕竟 Python 的多线程只能在一条跑道上运行。跑道满了，运行速度依然会慢。而在多个跑道上运行的任务必然是要比单一跑道效率会高很多。

Python创始人 Guido 之所以保留 GIL 锁，其实也是为了线程之间的安全。虽然这个话题一直都在争论，不过我们也有办法去掉这个 GIL全局锁。

默认的解释器是 Python 自带的解释器，这里我们可以选择一个叫做 pypy 的解释器。通过它来执行 Python 脚本是不含有 GIL全局锁的，但并不太推荐这种做法。

另外一种解决方法就是使用多进程 + 多线程的方式来弥补这一短板上的问题，通过多进程在每个 CPU 跑道上执行任务，并且每个进程的跑道上再去执行多个线程。，让它们在各自的时间片上去运行。这些用法会在后续的章节会介绍到，在此只需要了解即可。

以上就是Python学习之线程池与GIL全局锁详解的详细内容，更多关于Python线程池 GIL全局锁的资料请关注我们其它相关文章！

Python爬虫之线程池的使用

一.前言学到现在,我们可以说已经学习了爬虫的基础知识,如果没有那些奇奇怪怪的反爬虫机制,基本上只要有时间分析,一般的数据都是可以爬取的,那么到了这个时候我们需要考虑的就是爬取的效率了,关于提高爬虫效率,也就是实现异步爬虫,我们可以考虑以下两种方式:一是线程池的使用(也就是实现单进程下的多线程),一是协程的使用(如果没有记错,我所使用的协程模块是从python3.4以后引入的,我写博客时使用的python版本是3.9). 今天我们先来讲讲线程池. 二.同步代码演示我们先用普通的同步的形式写一段
Python 线程池用法简单示例

本文实例讲述了Python 线程池用法.分享给大家供大家参考,具体如下: # -*- coding:utf-8 -*- #! python3 ''' Created on 2019-10-2 @author: Administrator ''' from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor import os,time,random def task(n): print('%s is runing' %
python 深入了解GIL锁详细

目录 1.什么是GIL锁 2.CPython对线程安全的内存管理机制 3.GIL锁的产生 4.GIL锁的底层原理 5.Python GIL不能绝对保证线程安全 6.总结前言: python的使用者都知道Cpython解释器有一个弊端,真正执行时同一时间只会有一个线程执行,这是由于设计者当初设计的一个缺陷,里面有个叫GIL锁的,但他到底是什么?我们只知道因为他导致python使用多线程执行时,其实一直是单线程,但是原理却不知道,那么接下来我们就认识一下GIL锁 1.什么是GIL锁 GIL(Glo
python中GIL的原理及用法总结

1.说明 GIL规定一个Python解释程序只能同时由一个线程控制. 在CPU限制类型和多线程代码中,GIL是一个性能瓶颈. GIL使Python多线程成为伪并行多线程. 仅CPython解释器上存在GIL. 2.原理 (1)线程1.2.3轮流执行,每一个线程在执行是,都会锁住GIL,以阻止别的线程执行: 同样的,每一个线程执行一段后,会释放GIL,以允许别的线程开始利用资源. (2)由于古老GIL机制,如果线程2需要在CPU2上执行,它需要先等待在CPU1上执行的线程1释放GIL(记住:GIL
python线程池如何使用

线程池的使用线程池的基类是 concurrent.futures 模块中的 Executor,Executor 提供了两个子类,即 ThreadPoolExecutor 和ProcessPoolExecutor,其中 ThreadPoolExecutor 用于创建线程池,而 ProcessPoolExecutor 用于创建进程池. 如果使用线程池/进程池来管理并发编程,那么只要将相应的 task 函数提交给线程池/进程池,剩下的事情就由线程池/进程池来搞定. Exectuor 提供了如下常用方
浅谈Python中的全局锁(GIL)问题

CPU-bound(计算密集型) 和I/O bound(I/O密集型) 计算密集型任务(CPU-bound) 的特点是要进行大量的计算,占据着主要的任务,消耗CPU资源,一直处于满负荷状态.比如复杂的加减乘除.计算圆周率.对视频进行高清解码等等,全靠CPU的运算能力.这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数. 计算密集型任务由于主要消耗CPU资源,因
Python学习之线程池与GIL全局锁详解

目录线程池线程池的创建 - concurrent 线程池的常用方法线程池演示案例线程锁利用线程池实现抽奖小案例 GIL全局锁 GIL 的作用线程池线程池的创建 - concurrent concurrent 是 Python 的内置包,使用它可以帮助我们完成创建线程池的任务. 方法名介绍示例 futures.ThreadPoolExecutor 创建线程池 tpool=ThreadPoolExecutor(max_workers) 通过调用 concurrent 包的 futu
python多进程使用及线程池的使用方法代码详解

多进程:主要运行multiprocessing模块 import os,time import sys from multiprocessing import Process class MyProcess(Process): """docstring for MyProcess""" def __init__(self, arg, callback): super(MyProcess, self).__init__() self.arg = a
ThreadPoolExecutor线程池原理及其execute方法(详解)

jdk1.7.0_79 对于线程池大部分人可能会用,也知道为什么用.无非就是任务需要异步执行,再者就是线程需要统一管理起来.对于从线程池中获取线程,大部分人可能只知道,我现在需要一个线程来执行一个任务,那我就把任务丢到线程池里,线程池里有空闲的线程就执行,没有空闲的线程就等待.实际上对于线程池的执行原理远远不止这么简单. 在Java并发包中提供了线程池类--ThreadPoolExecutor,实际上更多的我们可能用到的是Executors工厂类为我们提供的线程池:newFixedThreadP
python学习字符串驻留与常量折叠隐藏特性详解

下面是Python字符串的一些微妙的特性,绝对会让你大吃一惊. 案例一: 案例二: 案例三: 很好理解, 对吧? 说明: 这些行为是由于 Cpython 在编译优化时, 某些情况下会尝试使用已经存在的不可变对象而不是每次都创建一个新对象. (这种行为被称作字符串的驻留[string interning]) 发生驻留之后, 许多变量可能指向内存中的相同字符串对象. (从而节省内存) 在上面的代码中, 字符串是隐式驻留的. 何时发生隐式驻留则取决于具体的实现. 这里有一些方法可以用来猜测字符串是否会
Python学习之私有函数,私有变量及封装详解

目录什么是私有函数和私有变量私有函数与私有变量的定义方法 Python中的封装面向对象编程小练习通过学习私有函数与私有变量,可以更好的完善类的开发 ,从而丰满我们的场景与实现方案. 什么是私有函数和私有变量私有函数与私有变量中的私有是什么意思? —> 简单理解就是独自拥有.不公开.不分享的意思.放到函数与变量中就是独自拥有的函数与独自拥有的变量,并且不公开.这样我们就理解了什么是私有函数与私有变量. 无法被实例化后的对象调用的类中的函数与变量虽然无法被实例化后的对象调用,但是在类
Java线程池队列PriorityBlockingQueue和SynchronousQueue详解

目录正文 PriorityBlockingQueue阻塞优先队列 SynchronousQueue 正文 public enum QueueTypeEnum { ARRAY_BLOCKING_QUEUE(1, "ArrayBlockingQueue"), LINKED_BLOCKING_QUEUE(2, "LinkedBlockingQueue"), DELAY_QUEUE(3, "DelayQueue"), PRIORITY_BLOCKING
Python实现线程池工作模式的案例详解

目录 01.客户机/服务器通信逻辑 02.数据交换协议 03.服务器主体逻辑 04.服务器会话线程 05.客户机主体逻辑 06.客户机发送数据 07.客户机接收数据 08.客户机界面设计 09.线程池 10.联合测试 11.小结本文章基于苹果树病虫害预测模型,自定义应用层通信逻辑,设计服务器与客户机.客户机向服务器发送图像数据,服务器回送预测结果.为增强服务器的可靠性与可扩展性,服务器端采用线程池工作模式.为了增强客户机的可操作性,客户机采用PyQt5完成图形化界面设计. 01.客户机/服务器
线程池的原理与实现详解

一. 线程池的简介通常我们使用多线程的方式是,需要时创建一个新的线程,在这个线程里执行特定的任务,然后在任务完成后退出.这在一般的应用里已经能够满足我们应用的需求,毕竟我们并不是什么时候都需要创建大量的线程,并在它们执行一个简单的任务后销毁. 但是在一些web.email.database等应用里,比如彩铃,我们的应用在任何时候都要准备应对数目巨大的连接请求,同时,这些请求所要完成的任务却又可能非常的简单,即只占用很少的处理时间.这时,我们的应用有可能处于不停的创建线程并销毁线程的状态.虽说比起
Python学习笔记之迭代器和生成器用法实例详解

本文实例讲述了Python学习笔记之迭代器和生成器用法.分享给大家供大家参考,具体如下: 迭代器和生成器迭代器每次可以返回一个对象元素的对象,例如返回一个列表.我们到目前为止使用的很多内置函数(例如 enumerate)都会返回一个迭代器. 是一种表示数据流的对象.这与列表不同,列表是可迭代对象,但不是迭代器,因为它不是数据流. 生成器是使用函数创建迭代器的简单方式.也可以使用类定义迭代器下面是一个叫做 my_range 的生成器函数,它会生成一个从 0 到 (x - 1) 的数字流:
Python学习笔记之字符串和字符串方法实例详解

本文实例讲述了Python学习笔记之字符串和字符串方法.分享给大家供大家参考,具体如下: 字符串在 python 中,字符串的变量类型显示为 str.你可以使用双引号 " 或单引号 ' 定义字符串定义字符串 my_string = 'this is a string!' my_string2 = "this is also a string!!!" # Also , we can use backslash '/' to escape quotes. this_strin