Python语法学习之进程的创建与常用方法详解

2025-02-18 06:45:26

该章节我们来学习一下在 Python 中去创建并使用多进程的方法，通过学习该章节，我们将可以通过创建多个进程来帮助我们提高脚本执行的效率。可以认为缩短脚本执行的时间，就是提高执行我们脚本的效率。接下来让我们都看一下今天的章节知识点都有哪些？

进程的创建模块 - multiprocessing

创建进程函数 - Process

函数名	介绍	参数	返回值
Process	创建一个进程	target, args	进程对象

Process功能介绍：实例化一个对象；它需要传入两个参数 target 与 args：target 是一个函数，args 是对应一个函数的参数(args参数是一个元组)。其实我们可以这样去理解，在一个脚本中创建子进程，目的是为了让它执行我们脚本中的某个函数。换句话讲，我们将脚本中的某一个函数单独的启用一个进程去执行。

我们说过进程之间互不干扰，可以同时执行。所以我们可以认为主进程中的程序和子进程的函数是相互不干扰的，听起来可能很难理解，一会儿下文我们进行一个案例的小练习，一遍帮助大家去更好的理解其中的含义。

进程的常用方法

函数名	介绍	参数	返回值
start	执行进程	无	无
join	阻塞进程	无	无
kill	杀死进程	无	无
is_alive	判断进程是否存活	无	bool

start 函数：通过调用它，可以直接启动我们创建的进程。它会马上执行我们进程中传入的函数，start 函数没有任何参数，也没有返回值。
join 函数：我们说过，主进程和子进程的程序会同时运行，互不影响。这样就会有一个问题，有可能是子进程先执行完它的业务，也有可能是主进程先执行完它的业务逻辑。如果有的时候我们必须要先执行完子进程的业务再执行主进程的业务。则通过调用 join 函数，在这一函数下面执行的主进程业务要等待子进程完成之后才会继续执行。我们将 join 这样的函数叫做等待/阻塞函数。join 函数没有任何参数，也没有返回值。
kill 函数：如果我们在执行子进程的过程中发现不需要这个子进程继续运行了，就可以使用 kill 函数杀死当前的这个子进程，杀死的这个子进程不会在执行子进程中函数的业务逻辑。kill 函数没有任何参数，也没有返回值。
is_alive 函数：通过调用这个函数可以判断当前的进程是否是存活状态，它返回一个 bool 值。True 表示当前进程还在，程序还在继续执行；如果是 False 则代表当前进程已经结束了

start 函数

演示案例：

我们先定义两个简单的函数，每个函数定义两个简单的 for 循环。
每执行一次循环，休眠一秒的时间。
在两次循环的开始定义一个实例化时间对象，用以计算两次循环的时间间隔。
同时，获取脚本执行的进程号; 看看是一个怎样的结果。

# coding:utf-8

import time
import os

def work_for_first():

    for i in range(5):
        print('\'work_for_first\' 函数的循环值：%s', '进程号为：%s' % i, os.getpid())	# os.getpid() 为获取进程号函数
        time.sleep(1)

def work_for_second():
    for i in range(5):
        print('\'work_for_second\' 函数的循环值：%s',  '进程号为：%s' % i, os.getpid())
        time.sleep(1)

if __name__ == '__main__':
    start_time = time.time()    # 获取执行 循环 之前的时间戳
    work_for_first()
    work_for_second()
    end_time = time.time() - start_time     # 获取执行 循环 结束的时间戳
    print('耗时时间为：{}, 进程号为：{}'.format(end_time, os.getpid()))  # 获取耗时与进程号

执行结果如下图：

OKK！接下来进入我们今天要学习的主题。

将 work_for_first() 函数创建一个新的子进程去执行。

# coding:utf-8

import time
import os
import multiprocessing

def work_for_first():

    for i in range(5):
        print('\'work_for_first\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

def work_for_second():
    for i in range(5):
        print('\'work_for_second\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

if __name__ == '__main__':
    start_time = time.time()    # 获取执行 循环 之前的时间戳
    work_for_first_process = multiprocessing.Process(target=work_for_first)     # 因为我们传入的函数没有参数所以 args 可以不写
    work_for_first_process.start()
    work_for_second()
    end_time = time.time() - start_time     # 获取执行 循环 结束的时间戳
    print('耗时时间为：{}, 进程号为：{}'.format(end_time, os.getpid()))  # 获取耗时与进程号

执行结果如下图：

因为我们针对 work_for_first() 函数创建一个新的子进程去执行，所以我们的耗时变为了 5秒。那么如果我们将 work_for_second() 函数也创建一个新的子进程去执行，耗时又会是多少呢？我们接着往下看。

# coding:utf-8

import time
import os
import multiprocessing

def work_for_first():

    for i in range(5):
        print('\'work_for_first\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

def work_for_second():
    for i in range(5):
        print('\'work_for_second\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

if __name__ == '__main__':
    start_time = time.time()    # 获取执行 循环 之前的时间戳
    work_for_first_process = multiprocessing.Process(target=work_for_first)     # 因为我们传入的函数没有参数所以 args 可以不写
    work_for_first_process.start()

    work_for_second_process = multiprocessing.Process(target=work_for_second)
    work_for_second_process.start()
    end_time = time.time() - start_time     # 获取执行 循环 结束的时间戳
    print('耗时时间为：{}, 进程号为：{}'.format(end_time, os.getpid()))  # 获取耗时与进程号

执行结果如下图：

PS：从脚本中执行入口的 main 函数可以看出 work_for_first() 函数与 work_for_second() 函数分别都由各自的子进程来执行，主进程实际执行的只有 23行、29行、30行代码，所以从耗时来看，主进程实际上只执行了 0.026 秒。

这里再思考一个问题，如果是每一个子进程都单独的通过 .start 去启动，那么在子进程很多的情况下，启动的确实会有一些慢了。这个时候我们就可以通过 for 循环的方式去启动子进程。方式如下：

    for sun_process in (work_for_first_process, work_for_second_process):
        sun_process.start()

join 函数

同样的也会存在着这样一种情况，我们希望子进程运行结束之后再去执行我们的主进程，这时候我们就会使用到 join 函数。

这里我们就利用上文的进程 for循环同时启动两个子进程，然后我们再在下一个 for循环执行 join 函数，我们看看会发生什么。

# coding:utf-8

import time
import os
import multiprocessing

def work_for_first():

    for i in range(5):
        print('\'work_for_first\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

def work_for_second():
    for i in range(5):
        print('\'work_for_second\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

if __name__ == '__main__':
    start_time = time.time()    # 获取执行 循环 之前的时间戳
    work_for_first_process = multiprocessing.Process(target=work_for_first)     # 因为我们传入的函数没有参数所以 args 可以不写
    # work_for_first_process.start()

    work_for_second_process = multiprocessing.Process(target=work_for_second)
    # work_for_second_process.start()

    for sun_process in (work_for_first_process, work_for_second_process):
        sun_process.start()

    for sun_process in (work_for_first_process, work_for_second_process):
        sun_process.join()

    end_time = time.time() - start_time     # 获取执行 循环 结束的时间戳
    print('耗时时间为：{}, 进程号为：{}'.format(end_time, os.getpid()))  # 获取耗时与进程号

执行结果如下图：

kill 函数与 is_alive 函数

接下来我们再尝试一个场景，利用 for 循环，我们同时启动 work_for_first() 函数与 work_for_second() 函数的子进程。然后我们再在另一个 for 循环中，将 work_for_second() 函数的子进程 kill 掉，然后判断两个子进程的存活状态。

示例脚本如下：

# coding:utf-8

import time
import os
import multiprocessing

def work_for_first():

    for i in range(5):
        print('\'work_for_first\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

def work_for_second():
    for i in range(5):
        print('\'work_for_second\' 函数的循环值：{}，进程号为：{}'.format(i, os.getpid()))
        time.sleep(1)

if __name__ == '__main__':
    start_time = time.time()    # 获取执行 循环 之前的时间戳
    work_for_first_process = multiprocessing.Process(target=work_for_first)     # 因为我们传入的函数没有参数所以 args 可以不写
    # work_for_first_process.start()

    work_for_second_process = multiprocessing.Process(target=work_for_second)
    # work_for_second_process.start()

    for sun_process in (work_for_first_process, work_for_second_process):
        sun_process.start()
        time.sleep(1)   # 休眠一秒是为了 work_for_second_process 子进程 至少能够运行一次

    for sun_process in (work_for_first_process, work_for_second_process):
        work_for_second_process.kill()
        if work_for_first_process.is_alive():
            print('\'work_for_first_process\' 子进程当前存活状态为：True')
        elif not work_for_second_process.is_alive():
            print('\'work_for_second_process\' 子进程当前存活状态为：False')

        sun_process.join()

    end_time = time.time() - start_time     # 获取执行 循环 结束的时间戳
    print('耗时时间为：{}, 进程号为：{}'.format(end_time, os.getpid()))  # 获取耗时与进程号

运行结果如下：

进程的相关问题

通过学习多进程的创建、启动，我们可以充分的体会到进程给我们带来的好处。它可以使我们的脚本程序执行时间进行缩短，从而提高工作效率。

然而多进程也有一些问题：

通过进程模块执行的函数无法获取返回值，即便这个函数拥有 return 关键字也无法获取到，这也是我们进程的弊端。
多个进程同时修改文件可能会出现错误。
进程数量太多可能会造成资源不足、甚至死机等情况。

关于进程的这些问题，其实也并不是不能解决。在后续更新的进程间的通信、进程池与进程锁的章节我们再进行详细的介绍。

到此这篇关于Python语法学习之进程的创建与常用方法详解的文章就介绍到这了,更多相关Python 进程创建内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python创建进程fork用法

本文实例讲述了python创建进程fork用法.分享给大家供大家参考.具体分析如下: #!coding=utf-8 import os ,traceback import time ''' fork()系统调用是Unix下以自身进程创建子进程的系统调用, 一次调用,两次返回,如果返回是0, 则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid) ''' source = 10 i = 0 try: print '***********************' pid = os.for
python 进程的几种创建方式详解

在新创建的子进程中,会把父进程的所有信息复制一份,它们之间的数据互不影响. 使用os.fork()创建该方式只能用于Unix/Linux操作系统中,在windows不能用. import os # 注意,fork函数,只在Unix/Linux/Mac上运行,windows不可以 pid = os.fork() # 子进程永远返回0,而父进程返回子进程的ID. if pid == 0: print('子进程') else: print('父进程') 使用Process类类创建 multiproc
Python 创建守护进程的示例

考虑如下场景:你编写了一个python服务程序,并且在命令行下启动,而你的命令行会话又被终端所控制,python服务成了终端程序的一个子进程.因此如果你关闭了终端,这个命令行程序也会随之关闭. 要使你的python服务不受终端影响而常驻系统,就需要将它变成守护进程. 守护进程就是Daemon程序,是一种在系统后台执行的程序,它独立于控制终端并且执行一些周期任务或触发事件,通常被命名为"d"字母结尾,如常见的httpd.syslogd.systemd和dockerd等. 代码实现 pyt
Python Process创建进程的2种方法详解

前面介绍了使用 os.fork() 函数实现多进程编程,该方法最明显的缺陷就是不适用于 Windows 系统.本节将介绍一种支持 Python 在 Windows 平台上创建新进程的方法. Python multiprocessing 模块提供了 Process 类,该类可用来在 Windows 平台上创建新进程.和使用 Thread 类创建多线程方法类似,使用 Process 类创建多进程也有以下 2 种方式: 直接创建 Process 类的实例对象,由此就可以创建一个新的进程: 通过继承 P
Python语法学习之进程的创建与常用方法详解

目录进程的创建模块 - multiprocessing 创建进程函数 - Process 进程的常用方法 start 函数 join 函数 kill 函数与 is_alive 函数进程的相关问题该章节我们来学习一下在 Python 中去创建并使用多进程的方法,通过学习该章节,我们将可以通过创建多个进程来帮助我们提高脚本执行的效率.可以认为缩短脚本执行的时间,就是提高执行我们脚本的效率.接下来让我们都看一下今天的章节知识点都有哪些? 进程的创建模块 - multiprocessing 创建
Python语法学习之线程的创建与常用方法详解

目录线程的创建与使用线程的创建 -threading 线程对象的常用方法线程演示案例线程的问题线程的创建与使用在Python中有很多的多线程模块,其中 threading 模块就是比较常用的.下面就来看一下如何利用 threading 创建线程以及它的常用方法. 线程的创建 -threading 函数名介绍举例 Thread 创建线程 Thread(target, args) Thread 的动能介绍:通过调用 threading 模块的 Thread 类来实例化一个线程对象:它
Python语法学习之进程池与进程锁详解

目录进程池什么是进程池进程池的创建模块 - multiprocessing 创建进程池函数 - Pool 进程池的常用方法 apply_async 函数演示案例 close 函数与 join 函数演示进程锁进程锁的概念进程锁的加锁与解锁 NICE!大家好,在上一章节,我们学习了 multiprocessing 模块的关于进程的创建与进场常用的方法的相关知识. 通过在一个主进程下创建多个子进程可以帮助我们加速程序的运行,并且提高工作效率.不过上一章节文末我们也说过进程的问题,由于每
Python语法学习之进程间的通信方式

目录什么是进程的通信队列的创建 - multiprocessing 进程之间通信的方法进程间的通信 - 队列演示案例批量给 send 函数加入数据小节进程间通信的其他方式 - 补充什么是进程的通信这里举一个例子接介绍通信的机制:通信一词大家并不陌生,比如一个人要给他的女友打电话.当建立了通话之后,在这个通话的过程中就是建立了一条隐形的队列 (记住这个词).此时这个人就会通过对话的方式不停的将信息告诉女友,而这个人的女友也是在倾听着.(嗯…我个人觉得大部分情况下可能是反着来的)
Python学习之文件的创建与写入详解

目录内置函数 - open 获取文件对象 open() 函数利用文件对象进行创建与写入文件操作的写入模式文件对象的写入操作方法实战小案例在前面章节我们通过 os包学习了如何创建.读取一个文件夹,但是并没有学习如何创建.读写一个文件,接下来我们就学习关于文件的处理.当我们学习完文件处理之后,就可以随意读写文件. 内置函数 - open 获取文件对象 open() 函数 open()函数是是python的读写文件的基本函数,它可以生成文件对象可以创建,也可以操作文件的读写. 用法: op
Python深度学习之图像标签标注软件labelme详解

前言 labelme是一个非常好用的免费的标注软件,博主看了很多其他的博客,有的直接是翻译稿,有的不全面.对于新手入门还是有点困难.因此,本文的主要是详细介绍labelme该如何使用. 一.labelme是什么? labelme是图形图像注释工具,它是用Python编写的,并将Qt用于其图形界面.说直白点,它是有界面的, 像软件一样,可以交互,但是它又是由命令行启动的,比软件的使用稍微麻烦点.其界面如下图: 它的功能很多,包括: 对图像进行多边形,矩形,圆形,多段线,线段,点形式的标注(可用于目
Python深度学习实战PyQt5布局管理项目示例详解

目录 1. 从绝对定位到布局管理 1.1 什么是布局管理 1.2 Qt 中的布局管理方法 2. 水平布局(Horizontal Layout) 3. 垂直布局(Vertical Layout) 4. 栅格布局(Grid Layout) 5. 表格布局(Form Layout) 6. 嵌套布局 7. 容器布局布局管理就是管理图形窗口中各个部件的位置和排列.图形窗口中的大量部件也需要通过布局管理,对部件进行整理分组.排列定位,才能使界面整齐有序.美观大方. 1. 从绝对定位到布局管理 1.1 什么
Python OpenCV学习之特征点检测与匹配详解

目录背景一.Harris角点二.Shi-Tomasi角点检测三.SIFT关键点四.SIFT描述子五.SURF 六.ORB 七.暴力特征匹配(BF) 八.FLANN特征匹配九.图像查找总结背景提取图像的特征点是图像领域中的关键任务,不管在传统还是在深度学习的领域中,特征代表着图像的信息,对于分类.检测任务都是至关重要的: 特征点应用的一些场景: 图像搜索:以图搜图(电商.教育领域) 图像拼接:全景拍摄(关联图像拼接) 拼图游戏:游戏领域一.Harris角点哈里斯角点检测主要
python爬虫学习笔记之pyquery模块基本用法详解

本文实例讲述了python爬虫学习笔记之pyquery模块基本用法.分享给大家供大家参考,具体如下: 相关内容: pyquery的介绍 pyquery的使用安装模块导入模块解析对象初始化 css选择器在选定元素之后的元素再选取元素的文本.属性等内容的获取 pyquery执行DOM操作.css操作 Dom操作 CSS操作一个利用pyquery爬取豆瓣新书的例子首发时间:2018-03-09 21:26 pyquery的介绍 pyquery允许对xml.html文档进行jQuery查询
python语法之语言元素和分支循环结构详解

目录一.语言元素 1.变量及其类型 (1)变量 (2)变量类型 2.变量命名规则 3.变量的使用 4.运算符二.分支循环结构 1.if 2.for-in 3.while 总结 python中严格控制缩进,一个tab键或者4个空格一.语言元素 1.变量及其类型 (1)变量所谓变量,就是可以改变的量. 首次使用变量会在内存中划分空间,并初始化值: 再次使用变量不再划分空间,修改原空间的. (2)变量类型 ①数值类型 int float bool:True.False ②字符串类型字符串运算