详解APScheduler如何设置任务不并发

2025-02-13 17:37:54

1.软件环境

Windows10 教育版64位
Python 3.6.3
APScheduler 3.6.3

2.问题描述

Python中定时任务的解决方案，总体来说有四种，分别是：crontab、 scheduler、 Celery、APScheduler，其中：

crontab是 Linux 的一个定时任务管理工具，在Windows上面有替代品pycron，但Windows不像 Linux那样有很多强大的命令程序，pycron使用起来有局限性，定制性不好；
Scheduler太过于简单、复杂一点的定时任务做起来太困难，特别是以月份以上时间单位的定时任务；
Celery依赖的软件比较多，比较耗资源；
APScheduler（Advanced Python Scheduler）基于 Quartz，可以跨平台而且配置方便，提供了date、interval、cron3种不同的触发器，与Linux上原生的 crontab 格式兼容，可以设置任何高度复杂的定时任务，灵活的要死。

在此不介绍APScheduler的基本特性，有需要的可以直接去看APScheduler官方文档，我们直接切到主题：

APScheduler如何设置任务不并发（即第一个任务执行完再执行下一个）？

APScheduler在多个任务相同时间点同时被触发时，会同时并发执行多个任务，如使用下方的示例代码：

'''
===========================================
  @author:  jayce
  @file:    apscheduler设置任务不并发.py
  @time:    2022/7/1/001   19:38
===========================================
'''
from apscheduler.schedulers.blocking import BlockingScheduler
import time

def job_printer(text):
    '''
    死循环，用来模拟长时间执行的任务
    :param text:
    :return:
    '''
    while True:
        time.sleep(2)
        print("job text：{}".format(text))

if __name__ == '__main__':
    schedule = BlockingScheduler()

    schedule.add_job(job_printer, "cron", second='*/10', args=['每10秒执行一次！'])
    schedule.add_job(job_printer, "cron", second='*/20', args=['每20秒执行一次！'])

    schedule.print_jobs()
    schedule.start()

可以看到，函数job_printer是一个死循环，用来模拟长时间执行的任务，我们使用add_job向APScheduler中添加2个job_printer，区别是2个任务的时间间隔为：每10秒执行一次和每20秒执行一次。
因为job_printer是一个死循环，相当于job_printer一直没有被执行完，但其实APScheduler在任务没有被执行完的情况下，同时执行多个不同的job_printer：

job text：每10秒执行一次！
job text：每20秒执行一次！
job text：每10秒执行一次！
job text：每20秒执行一次！
job text：每10秒执行一次！
job text：每20秒执行一次！
job text：每10秒执行一次！
job text：每20秒执行一次！
job text：每10秒执行一次！
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 20:47:50 CST)" skipped: maximum number of running instances reached (1)

即：

可以看到10秒的job_printer和20秒的job_printer交替被执行，而其实10秒的job_printer其实根本没有执行完。这在CPU或者GPU等硬件设备能够承担负载的情况下，当然是好事，但如果你的硬件不够的话，发生OOM等资源不够的情况，程序就被中断了，导致你的模型训练或业务逻辑失败！
具体的：
我这边是使用APScheduler和Tensorflow进行在线学习（online learning）时，在不同的时间节点下会对模型使用不一样的重训练方式，如有2个定时任务（A：每10秒执行一次，B：每20秒执行一次）和2种重训练方式（X和Y），当你的显存存在如下情况：

显存很少只够一个程序进行训练，不能多个程序同时运行，否则会OOM；

那么只能引导程序依次执行，而不能并发执行，等当同一时间内X和Y同时被触发时，只执行其中1个，另外1个不执行。

那这个时候又该怎么办呢

3.解决方法

通过查阅官方文档，发现可以通过设置执行任务的线程数，来控制只有1个执行器进行任务的执行，进而达到执行完任务X再执行任务Y，具体如下：

'''
===========================================
  @author:  jayce
  @file:    apscheduler设置任务不并发.py
  @time:    2022/7/1/001   19:38
===========================================
'''
from apscheduler.executors.pool import ThreadPoolExecutor

if __name__ == '__main__':
    # 为了防止全量和增量并发造成显存溢出，进而训练失败，设置同一时间只能有一个任务运行
    schedule = BlockingScheduler(executors={'default': ThreadPoolExecutor(1)})

通过向BlockingScheduler设定最大的ThreadPoolExecutor=1，即可达到我们想要的效果!

4.结果预览

job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 21:17:50 CST)" skipped: maximum number of running instances reached (1)
job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
job text：每10秒执行一次！
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 21:18:00 CST)" skipped: maximum number of running instances reached (1)
Execution of job "job_printer (trigger: cron[second='*/20'], next run at: 2022-07-01 21:18:00 CST)" skipped: maximum number of running instances reached (1)

即：

可以看到，一直在执行第1个被触发的任务，相同时间被触发的任务都被skipped了~~
当然，如果你想要第1个任务执行完时，执行被跳过的任务，可以通过在add_job中设置misfire_grace_time实现！

FAQ

1.APScheduler如果某个任务挂掉了，整个定时任务程序会中断吗？还是下次时间继续执行该任务？

答案是：程序不会中断，到下次执行任务的时间点，还会重新执行。
具体的，使用如下测试代码：

'''
===========================================
  @author:  jayce
  @file:    apscheduler设置任务不并发.py
  @time:    2022/7/1/001   19:38
===========================================
'''
from apscheduler.schedulers.blocking import BlockingScheduler
from apscheduler.executors.pool import ThreadPoolExecutor
import time

def exception_maker():
    '''
    异常制造器，用来模拟任务执行被中断
    :return:
    '''
    return 1 / 0

def job_printer(text):
    '''
    死循环，用来模拟长时间执行的任务
    :param text:
    :return:
    '''
    while True:
        time.sleep(2)
        print("job text：{}".format(text))

if __name__ == '__main__':
    schedule = BlockingScheduler()

    schedule.add_job(job_printer, "cron", second='*/10', args=['每10秒执行一次！'])
    schedule.add_job(exception_maker, "cron", second='*/5')

    schedule.print_jobs()
    schedule.start()

可以看到exception_maker已经失败多次，但是不影响其他任务和它自身的下次执行：

Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:30 CST)" raised an exception
Traceback (most recent call last):
File "C:\Users\Jayce\Anaconda3\envs\tf2.3\lib\site-packages\apscheduler\executors\base.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代码/apscheduler设置任务不并发.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:35 CST)" raised an exception
Traceback (most recent call last):
File "C:\Users\Jayce\Anaconda3\envs\tf2.3\lib\site-packages\apscheduler\executors\base.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代码/apscheduler设置任务不并发.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text：每10秒执行一次！
job text：每10秒执行一次！
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:40 CST)" raised an exception
Traceback (most recent call last):
File "C:\Users\Jayce\Anaconda3\envs\tf2.3\lib\site-packages\apscheduler\executors\base.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代码/apscheduler设置任务不并发.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text：每10秒执行一次！
job text：每10秒执行一次！
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 19:53:40 CST)" skipped: maximum number of running instances reached (1)
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:45 CST)" raised an exception
Traceback (most recent call last):
File "C:\Users\Jayce\Anaconda3\envs\tf2.3\lib\site-packages\apscheduler\executors\base.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代码/apscheduler设置任务不并发.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text：每10秒执行一次！

即：

到此这篇关于详解APScheduler如何设置任务不并发的文章就介绍到这了,更多相关APScheduler 任务不并发内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Python定时任务APScheduler安装及使用解析

1.简介 APScheduler是一个 Python 定时任务框架,使用起来十分方便.提供了基于日期.固定时间间隔以及 crontab 类型的任务,并且可以持久化任务.并以 daemon 方式运行应用. 2.APScheduler四个组件 APScheduler 四个组件分别为:触发器(trigger),作业存储(job store),执行器(executor),调度器(scheduler). 触发器(trigger) 包含调度逻辑,每一个作业有它自己的触发器,用于决定接下来哪一个作业会运行.除
Python定时任务框架APScheduler原理及常用代码

APScheduler简介在平常的工作中几乎有一半的功能模块都需要定时任务来推动,例如项目中有一个定时统计程序,定时爬出网站的URL程序,定时检测钓鱼网站的程序等等,都涉及到了关于定时任务的问题,第一时间想到的是利用time模块的time.sleep()方法使程序休眠来达到定时任务的目的,虽然这样也可以,但是总觉得不是那么的专业,^_^所以就找到了python的定时任务模块APScheduler: APScheduler基于Quartz的一个Python定时任务框架,实现了Quartz的所有功
python定时任务apscheduler的详细使用教程

目录前言安装主要组成部分简单应用完整代码总结前言我们项目中总是避免不了要使用一些定时任务,比如说最近的项目,用户点击报名考试以后需要在考试日期临近的时候推送小程序消息提醒到客户微信上,翻了翻 fastapi 中的实现,虽然方法和包也不少,但是要不就是太重了(比如需要再开服务,还要依赖 redis,都不好用),虽然也可以使用 time 模块的 time.sleep()机上 fastapi 的后台任务变相实现,但是相对简单的功能还行,复杂点的代码起来就麻烦了,所以还是专人专事找个负责
Python使用apscheduler模块设置定时任务的实现

目录一.安装二.ApScheduler 简介 1 APScheduler的组件 2 调度器的种类 3 内置的触发器类型三.使用举例 1 使用date类型的触发器 2 使用interval类型的触发器 3 使用cron类型的触发器四.定时器使用装饰器的方法一.安装 pip install apscheduler 二.ApScheduler 简介 1 APScheduler的组件 triggers:触发器triggers包含任务执行的调度逻辑,决定任务按照什么逻辑进行定时执行 job st
Python中定时任务框架APScheduler的快速入门指南

前言大家应该都知道在编程语言中,定时任务是常用的一种调度形式,在Python中也涌现了非常多的调度模块,本文将简要介绍APScheduler的基本使用方法. 一.APScheduler介绍 APScheduler是基于Quartz的一个python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务. APScheduler提供了多种不同的调度器,方便开发者根据自己的实际需要进行使用:同时也提供了不同的存储机
Python定时任务APScheduler的实例实例详解

APScheduler 支持三种调度任务:固定时间间隔,固定时间点(日期),Linux 下的 Crontab 命令.同时,它还支持异步执行.后台执行调度任务. 一.基本架构触发器 triggers:设定触发任务的条件描述一个任务何时被触发,按日期或按时间间隔或按 cronjob 表达式三种方式触发任务存储器 job stores:存放任务,可以放内存(默认)或数据库注:调度器之间不能共享任务存储器执行器 executors:用于执行任务,可设定执行模式将指定的作业提交到线程池或者进程
Python定时任务APScheduler原理及实例解析

定时任务: 1. 线程睡眠函数 sleep() --粗暴!一直占有 CPU 资源,导致后续操作无法执行 2. threading.Timer(10, task, ()).start() # (间隔s,任务task, 函参) 3. import sched # 初始化 sched 模块的 scheduler 类 scheduler = sched.scheduler(time.time, time.sleep) # 增加调度任务 enter(delay, priority, action, arg
Python使用APScheduler实现定时任务过程解析

前言 APScheduler是基于Quartz的一个Python定时任务框架.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务. 在线文档:https://apscheduler.readthedocs.io/en/latest/userguide.html 一.安装APScheduler pip install apscheduler 二.基本概念 APScheduler有四大组件: 1.触发器 triggers : 触发器包含调度逻辑.每个作业都有自己的触发器,用
Python定时任务工具之APScheduler使用方式

APScheduler (advanceded python scheduler)是一款Python开发的定时任务工具. 文档地址 apscheduler.readthedocs.io/en/latest/u- 特点: 不依赖于Linux系统的crontab系统定时,独立运行可以动态添加新的定时任务,如下单后30分钟内必须支付,否则取消订单,就可以借助此工具(每下一单就要添加此订单的定时任务) 对添加的定时任务可以做持久保存 1 安装 pip install apscheduler 2 组
详解APScheduler如何设置任务不并发

目录 1.软件环境 2.问题描述 3.解决方法 4.结果预览 FAQ 1.软件环境 Windows10 教育版64位Python 3.6.3APScheduler 3.6.3 2.问题描述 Python中定时任务的解决方案,总体来说有四种,分别是:crontab. scheduler. Celery.APScheduler,其中: crontab是 Linux 的一个定时任务管理工具,在Windows上面有替代品pycron,但Windows不像 Linux那样有很多强大的命令程序,pycron
详解Servlet入门级设置(超详细 IDEA2020版)

第一次用IntelliJ IDEA写java代码,之前都是用eclipse,但eclipse太老了. 下面为兄弟们奉上IntelliJ IDEA创建Servlet方法,写这个的目的也是因为很多视频教程还在用2017版的IDEA(并不是针对大家用老版本,只是吐槽一下版本更新迭代),所以把我走过的坑和弯路直接告诉兄弟们,为大家节省点宝贵的时间. 说一下现在创建Servlet或者是web和之前的主要区别,之前是直接创建,现在是先要创建java项目然后通过添加支持框架变成Servlet或者web项目
详解java解决分布式环境中高并发环境下数据插入重复问题

java 解决分布式环境中高并发环境下数据插入重复问题前言原因:服务器同时接受到的重复请求现象:数据重复插入 / 修改操作解决方案 : 分布式锁对请求报文生成摘要信息 + redis 实现分布式锁工具类分布式锁的应用 package com.nursling.web.filter.context; import com.nursling.nosql.redis.RedisUtil; import com.nursling.sign.SignType; import com.nu
详解小程序设置缓存并且不覆盖原有数据

最近在写小程序的小项目,因为是刚上手小程序,这途中遇到了许多问题,所幸在自己的坚持不懈下基本都得到了解决,今天就记录一下怎么设置缓存数据并且不覆盖吧,如果有错误的地方麻烦大家指正,互相学习一下! 这是官方的关于缓存的说明,它会覆盖掉之前的内容.我还是直接上源码吧这是writecomment.js文件 Page({ /** * 页面的初始数据 */ data: { }, submit: function (event) { var writecomment = event.detail.valu
详解Angular4 路由设置相关

1.路由相关配置路由类设置 /*路由基本模型*/ /*导入RouterModule,Routes类型*/ import { RouterModule, Routes } from '@angular/router'; import { LoginComponent } from "./login/login.component"; /*定义路由const表示不可改变*/ const routers: Routes = [ /* path:字符串,表示默认登入, path为路径 /lo
详解为 Docker 设置代理

因为众所周知的原因,Docker在国内的使用举步维艰.于是,很多组织在国内提供了mirror或者叫加速器. 甚至在1.13的release note中提到微软提供了官方的中国镜像,然后我并没有找到怎么启用,找到了再写. 使用这些镜像或者加速器,拉取各种官方镜像是ok了,自有的镜像也可以放在国内的registry. 但是官方镜像只是沧海一粟,大量的组织或个人的镜像都在docker hub,这一部分并没有被镜像同步. 于是,你还是需要一个代理. 本文假设: 你已经有一个http代理了 Linux发行
详解MySQL数据库设置主从同步的方法

简介 MySQL主从同步是目前使用比较广泛的数据库架构,技术比较成熟,配置也不复杂,特别是对于负载比较大的网站,主从同步能够有效缓解数据库读写的压力. MySQL主从同步的机制: MySQL同步的流程大致如下: 1.主服务器(master)将变更事件(更新.删除.表结构改变等等)写入二进制日志(master log). 2.从服务器(slave)的IO线程从主服务器(binlog dump线程)获取二进制日志,并在本地保存一份自己的二进制日志(relay log) 3.从服务器的SQL线程读取本
jquery操作select详解(取值,设置选中)

每一次操作select的时候,总是要出来翻一下资料,不如自己总结一下,以后就翻这里了. 比如<select class="selector"></select> 1.设置value为pxx的项选中 $(".selector").val("pxx"); 2.设置text为pxx的项选中 $(".selector").find("option[text='pxx']").attr(&qu
详解SpringMVC中设置静态资源不被拦截的问题

这两天使用SpringMVC来做登录,注册的小demo,其中用到了springmvc拦截器对登录操作进行拦截处理,并对url进行验证.验证通过则可以进行handler的处理,如果验证不通过直接跳回或者重定向到指定的页面. 但是在做这个操作的时候,遇到很大的一个问题就是项目demo中的静态资源都会在每次请求中被拦截处理了!跳回页面的时候,页面就不再是想想中的呈现的样子了. 以为我在springmvc.xml中已经配置了拦截器和静态资源的配置却还是出现这样的结果,所以就又是看前段浏览器的设置,又是看
详解Xcode 9 设置 iOS无线真机调试

本篇文章主要介绍了Xcode 9 设置 iOS无线真机调试,分享给大家,具体如下: 环境要求: 至少Mac OSX 10.12.6 iOS 11 Xcode 9 第一种情况在笔者写作之前,Mac 和 iPhone 通过wifi连接的是同一个路由器,也即同一个局域网,这种情况需要的操作相对简单. 接下来进行操作: 1. "自己的工程" -> windows -> Device and Simulators ,打开设备和模拟器界面 Device and Simulators

详解APScheduler如何设置任务不并发

目录

1.软件环境

2.问题描述

3.解决方法

4.结果预览

FAQ

相关推荐

随机推荐