浅谈并发处理PHP进程间通信之外部介质

进程间通信

进程间通信,指至少两个进程或线程间传送数据或信号的一些技术或方法。进程是计算机系统分配资源的最小单位(严格说来是线程)。每个进程都有自己的一部分独立的系统资源,彼此是隔离的。为了能使不同的进程互相访问资源并进行协调工作,才有了进程间通信。

根据定义可知,要进行进程间通信,我们需要解决两个问题:

  • 互相访问:消息传输和暂时存储介质选择问题;
  • 协调工作:消息的存取冲突问题;

文章介绍的中心就是围绕着这么两点来说的, 为了更使文章更简明,这边以之前在公司做的一个需求为例:

需要一个循环ID生成器,循环生成从 Min 到 Max 的数字ID,在ID递增到 Max 后,返回到 Min 重新开始递增;必须能保证多个进程并发请求时生成的ID不同。

此需求要解决的问题恰好为我们要解决的进程间通信需要解决的两个问题:

  • 需要一个消息传输通道来传输和存储当前的递增值。这个比较容易解决,我们常用的文件、数据库、session、缓存等都能做到。
  • 需要解决多进程同时访问生成器生成相同ID的问题。要满足这个需要就必须要用到锁了,而且为了保证多个进程读取的数据是不同的,需要互斥锁,另外为了能保证调用成功率,锁的获取最好能实现自旋。

本文通过此需求的不同实现,来介绍通过外部介质进行的进程间通信的方式。另外,不只PHP语言,其他语言也能使用这些方法。

文件

flock

文件是最基本的存储介质,它当然可以作为消息的传输通道来使用。文件的存取各种语言都有各自的多种方案,问题点是多进程并发时的冲突问题。

解决存取冲突问题我们使用PHP的flock()函数:

bool flock ( resource $handle , int $operation [, int &$wouldblock ] )

$handler 是 使用fopen($path_to_file)获取到的文件句柄;

$operation 是 对文件加锁的方式,有以下值可选:

LOCK_SH (获取共享锁) / LOCK_EX (获取互斥锁) / LOCK_UN (解锁)

这里我们选用互斥锁,一个进程获取到互斥锁后,其他进程在尝试获取锁会被阻塞,直到锁被释放,即实现了自旋;

此外,还有一个参数 LOCK_NB,flock 在获取不到锁时,默认会阻塞住直到锁被其他进程释放,传入 LOCK_NB 与 LOCK_SH 或 LOCK_EX 进行或运算结果(LOCK_EX | LOCK_NB),flock 在锁被其他进程占有时,不会阻塞,而是直接返回 false,这里仅作介绍,我们并不使用它。

$wouldblock 参数是一个引用值,在获取不到锁,且不阻塞模式时,$wouldblock 会被设置为 true;(手册中说阻塞时才会被设置为 true。其实我也奇怪这个变量名的。不知道是不是 bug,我的PHP版本是 5.4.5,有知道的烦请解惑)

代码实现

下面是循环ID生成器代码,说明在注释中:

function getCycleIdFromFile($max, $min = 0) {
    $handler = fopen('/tmp/cycle_id_generator.txt', 'c+');
    if (!flock($handler, LOCK_EX)) {
        throw new Exception('error_get_file_lock!');
    }

    $cycle_id = trim(fread($handler, 9));
    $cycle_id++;

    if ($cycle_id > $max) {
        $cycle_id = $min;
    }

    // 文件指针返回到文件头,并向文件内写入新的cycle_id
    rewind($handler);
    fwrite($handler, $cycle_id);

    // 多写入一些空格为了防止数值升到多位后,突然置为少位后面的数字仍保留
    fwrite($handler, str_repeat(' ', 9));

    flock($handler, LOCK_UN);

    return $cycle_id;
}

mysql

select for update

我们常用的 mysql 也可以被当作中间介质来实现进程间的通信,我们规定好某一个数据表内的某一行数据作为消息交换的中转站,使用 mysql 自带的锁来协调多个进程的存取冲突。

事务的设计目的就是为了解决多进程并发查询时数据冲突的问题,可是我们常用的事务只能保证数据冲突时会被回滚,数据不会出现错误,并不能实现请求的并行化。对一些数据冲突回滚的请求,需要我们在外层添加逻辑重试。

这里介绍 mysql 的一种语法: select for update,会给固定数据加上互斥锁,且另一个请求在获取锁失败时,会阻塞至获取锁成功,mysql 帮我们实现了自旋;

用法如下:

1.关闭 mysql 的自动提交,自动提交默认打开,除非使用 transition 语句显示开启事务,默认会将每一条 sql 作为一个事务直接提交执行,这里关闭。 set autocommit=0;

2.使用select for update 语句给数据添加互斥锁。注意:需求 mysql 的 innodb 引擎支持;

3.进行数据更新和处理操作;

4.主动提交事务,并将 自动提交恢复;commit; set autocommit=1;

代码实现

然后是代码实现:

// 数据库连接实现各有不同,demo 可以自己修改一下。
function getCycleIdFromMysql($max, $min = 0){
    Db::db()->execute('set autocommit = 0');
    $res = Db::db()->qsqlone('SELECT cycle_id FROM cycle_id_generator WHERE id = 1 FOR UPDATE');

    $cycle_id = $res['cycle_id'] + 1;
    if($cycle_id > $max){
        $cycle_id = $min;
    }

    Db::db()->execute("UPDATE cycle_id_generator SET cycle_id = {$cycle_id} WHERE id = 1");

    Db::db()->execute('commit');
    Db::db()->execute('set autocommit = 1');

    return $cycle_id;
}

redis

incr

redis 是我们常用的缓存服务器,由于其使用内存存储数据,性能很高。我们使用一个固定的普通键来作为消息中转站,然后利用其incr命令的原子性和其执行结果(递增后的值),实现 cycle_id 的递增。

incr(key) 若 key 不存在,redis 会先将值设置为0,然后执行递增操作;

递增没有问题,可是我们还有个需求是在要其值达到 max 时,再将其置为 min,这时就可能会出现进程A在更新值为 min 时,另一个进程B也检测到值大于了 max,然后将值置为 min,可是这时的值已经不是 max,即发生了值重复更新,那么返回的值必然会有重复;

这时,我们就需要自己来实现锁了。

SETNX

redis 的 SETNX 命令检测某一个 key 是否存在,若不存在,则将 key 的值设置为 value,并返回结果1; 若 key 已存在,则设置失败,返回值0。

SETNX key value

它能实现锁是因为它是一个原子命令,即 检测 key 是否存在和设置 key 值在一个事务内,不会出现同时两个进程都检测到 key 不存在,然后同时去设置 key 的情况。

我们以另一个值的存在与否,来表示 cycle_id 是否正在被另一个进程修改。

代码实现

 function getCycleIdFromRedis($max, $min = 0) {
    $redis = new Redis();
    $redis->connect('127.0.0.1', 6379);
    $key_id = 'cycle_id_generator';

    $cycle_id = $redis->incr($key_id);

    if ($cycle_id > $max) {
        // 设置"锁键"的结果 = 获取互斥结果
        $key_lock = 'cycle_id_lock';
        if (!$redis->setnx($key_lock, 1)) {
            return null;
        }

        $cycle_id = $min;
        $redis->set($key_id, $cycle_id);

        // 最后别忘记释放互斥锁
        $redis->delete($key_lock);
    }

    $redis->close();

    return $cycle_id;
}

注意:由于 redis 里没有能实现自旋锁的命令,如果需求最高的获取成功率,我们在检测到 cycle_id 已经是最大值,且试图修改获取锁失败时,退出重试,在外层进行重试。

function getCycleId($max, $min = 0) {
    $cycle_id = getCycleIdFromRedis($max, $min);
    if (!is_null($cycle_id)) {
        return $cycle_id;
    }
    // 稍微等待下正在更改的进程
    usleep(500);
    // 这里使用递归,直至获取成功  并发很高,cycle_id重置很频繁时慎用.
    return getCycleId($max, $min);
}

优化

审查代码我们会发现,如果 max-min 的值很小的话,redis 会需要经常重置 key 的值,也就经常需要加锁,重试也就很多。这里,我提供一个优化方法:

我们将其 max 设置为一个很大的值(要能被 max-min 整除),返回值时稍做处理,返回 $current % ($max - $min) + $min;。这样,key 需要递增到一个很大的值才会被重置,加锁逻辑和外层逻辑会很少执行到,达到提升效率的目的。

总结

这里简单的评价一下上面所说的三种方法:

性能上没有测试,而且 redis 的性能跟 ID 的大小差值相关,不过猜测在ID大小差值大的情况下 redis 应该更好一点。

代码上非常直观,使用 mysql 非常简洁,而且 redis 要自己实现自旋,比较恶心。

实现上,当然是文件最为方便,无任何添加。

以上就是浅谈并发处理PHP进程间通信之外部介质的详细内容,更多关于并发处理PHP进程间通信之外部介质的资料请关注我们其它相关文章!

(0)

相关推荐

  • PHP高并发和大流量解决方案整理

    一.高并发的概念 在互联网时代,并发,高并发通常是指并发访问.也就是在某个时间点,有多少个访问同时到来. 二.高并发架构相关概念 1.QPS (每秒查询率) : 每秒钟请求或者查询的数量,在互联网领域,指每秒响应请求数(指HTTP请求) 2.PV(Page View):综合浏览量,即页面浏览量或者点击量,一个访客在24小时内访问的页面数量 --注:同一个人浏览你的网站的同一页面,只记做一次pv 3.吞吐量(fetches/sec) :单位时间内处理的请求数量 (通常由QPS和并发数决定) 4.响

  • 浅谈并发处理PHP进程间通信之System V IPC

    前言 它的安装和使用非常简单,在编译 PHP 时添加 --enable-sysvsem --enable-sysvshm --enable-sysvmsg 参数就可以,当然 Windows 上无法使用. 今天我们仍旧使用上一篇文章的例子来介绍 PHP 内部实现的进程间通信,在了解它们的具体使用之前,先简单介绍一下信号量.共享内存.消息队列的概念. Unix System V IPC 信号量 信号量又称为信号灯,它是用来协调不同进程间的数据对象的,而最主要的应用是共享内存方式的进程间通信.本质上,

  • php多进程模拟并发事务产生的问题小结

    前言 本文通过实例代码给大家介绍了关于php多进程模拟并发事务产生的一些问题,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 表 drop table if exists `test`; create table if not exists `test` ( id int not null auto_increment , count int default 0 , primary key `id` (`id`) ) engine=innodb character set utf

  • 浅谈Swoole并发编程的魅力

    场景介绍 假设我们要做一个石头剪刀布的Web游戏,3个玩家同时提交竞猜后显示胜者.在传统串行化Web编程中,我们一般思路是这样: 设置form表单,用户提交竞猜后保存到MySQL/Redis存储 添加一个查看结果按钮,如果未全部完成,显示正在等待其他人提交.当3个人全部提交时,查询存储,并显示最终结果 并发编程 这个场景就可以使用Swoole实现并发编程,无需依赖MySQL/Redis存储,在内存中可以完成竞猜. 当有用户提交竞猜时,hold住请求,不返回结果,用户进入等待状态.当前请求和连接保

  • php多进程并发编程防止出现僵尸进程的方法分析

    本文实例讲述了php多进程并发编程防止出现僵尸进程的方法.分享给大家供大家参考,具体如下: 对于用PHP进行多进程并发编程,不可避免要遇到僵尸进程的问题. 僵尸进程是指的父进程已经退出,而该进程dead之后没有进程接受,就成为僵尸进程(zombie)进程.任何进程在退出前(使用exit退出) 都会变成僵尸进程(用于保存进程的状态等信息),然后由init进程接管.如果不及时回收僵尸进程,那么它在系统中就会占用一个进程表项,如果这种僵尸进程过多,最后系统就没有可以用的进程表项,于是也无法再运行其它的

  • PHP 并发场景的几种解决方案

    在秒杀,抢购等并发场景下,可能会出现超卖的现象,在PHP语言中并没有原生提供并发的解决方案,因此就需要借助其他方式来实现并发控制. 列出常见的解决方案有: 使用队列,额外起一个进程处理队列,并发请求都放到队列中,由额外进程串行处理,并发问题就不存在了,但是要额外进程支持以及处理延迟严重,本文不先不讨论这种方法. 利用数据库事务特征,做原子更新,此方法需要依赖数据库的事务特性. 借助文件排他锁,在处理下单请求的时候,用flock锁定一个文件,成功拿到锁的才能处理订单. 一.利用 Redis 事务特

  • 详解PHP中curl_multi并发的实现

    PHP中的curl_multi系列函数可以实现同时请求多个URL来实现并发,而不是像普通curl函数那样请求后会阻塞,直到结果返回才进行下一个请求.因此在批量请求URL时可通过curl_multi系列函数提升程序的运行效率. curl普通请求 $startTime = microtime(true); $chArr = []; $optArr = [ CURLOPT_URL => 'http://www.httpbin.org/ip', CURLOPT_HEADER => 0, CURLOPT

  • PHP下用Swoole实现Actor并发模型的方法

    什么是Actor? Actor对于PHPer来说,可能会比较陌生,写过Java的同学会比较熟悉,Java一直都有线程的概念(虽然PHP有Pthread,但不普及),它是一种非共享内存的并发模型,每个Actor内的数据独立存在,Actor之间通过消息传递的形式进行交互调度,且Actor是一种高度抽象化的编程模型,非常适合于游戏.硬件行业. Swoole协程与信箱 得益于Swoole4.x,我们可以基于Swoole的协程与Channel快速实现一个信箱模式调度.模拟代码如下: use Swoole\

  • PHP+Redis链表解决高并发下商品超卖问题(实现原理及步骤)

    上一篇文章聊了一下使用Redis事务来解决高并发商品超卖问题,今天我们来聊一下使用Redis链表来解决高并发商品超卖问题. 实现原理 使用redis链表来做,因为pop操作是原子的,即使有很多用户同时到达,也是依次执行,推荐使用. 实现步骤 第一步,先将商品库存入队列 /** * 添加商品数量到商品队列 * @param int $couponId 优惠券ID */ function addCoupons($couponId) { //1.初始化Redis连接 $redis = new Redi

  • 浅谈并发处理PHP进程间通信之外部介质

    进程间通信 进程间通信,指至少两个进程或线程间传送数据或信号的一些技术或方法.进程是计算机系统分配资源的最小单位(严格说来是线程).每个进程都有自己的一部分独立的系统资源,彼此是隔离的.为了能使不同的进程互相访问资源并进行协调工作,才有了进程间通信. 根据定义可知,要进行进程间通信,我们需要解决两个问题: 互相访问:消息传输和暂时存储介质选择问题: 协调工作:消息的存取冲突问题: 文章介绍的中心就是围绕着这么两点来说的, 为了更使文章更简明,这边以之前在公司做的一个需求为例: 需要一个循环ID生

  • 浅谈Linux进程间通信方式及优缺点

    1)管道 管道分为有名管道和无名管道 无名管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用.进程的亲缘关系一般指的是父子关系.无明管道一般用于两个不同进程之间的通信.当一个进程创建了一个管道,并调用fork创建自己的一个子进程后,父进程关闭读管道端,子进程关闭写管道端,这样提供了两个进程之间数据流动的一种方式. 有名管道也是一种半双工的通信方式,但是它允许无亲缘关系进程间的通信. 2)信号量 信号量是一个计数器,可以用来控制多个线程对共享资源的访问.,它不是用于交

  • 浅谈MUI框架中加载外部网页或服务器数据的方法

    我们很多同学在实施使用MUI框架的时候,在打开新的页面的时候常使用的方式是:mui.openwindow的方法,然而遇到网页需要从服务器或者是要嵌套外部的网页的时候,由于网速的问题会遇到加载时出现白屏,等待时间过长,导致用户体验不好. 页面加载的时候使用plus.webview.create方法就很好的解决了这个问题. 废话不多说直接贴代码 首先我们需要在创建一个父页面,以下是父页面的JS // H5 plus事件处理 function plusReady(){ var nwaiting = p

  • 浅谈springboot内置tomcat和外部独立部署tomcat的区别

    前两天,我去面了个试,面试官问了我个问题,独立部署的tomcat跟springboot内置的tomcat有什么区别,为什么存在要禁掉springboot的tomcat然后将项目部署到独立的tomcat当中? 我就想,不都一个样?独立部署的tomcat可以配置优化?禁AJP,开多线程,开nio?而且springboot内置的tomcat多方便,部署上服务器写个java脚本运行即可.现在考虑下有什么条件能优于内置tomcat的. 1.tomcat的优化配置多线程?内置的也可以配置多线程 server

  • 浅谈Android中Service的注册方式及使用

    Service通常总是称之为"后台服务",其中"后台"一词是相对于前台而言的,具体是指其本身的运行并不依赖于用户可视的UI界面,因此,从实际业务需求上来理解,Service的适用场景应该具备以下条件: 1.并不依赖于用户可视的UI界面(当然,这一条其实也不是绝对的,如前台Service就是与Notification界面结合使用的): 2.具有较长时间的运行特性. 1.Service AndroidManifest.xml 声明 一般而言,从Service的启动方式上

  • 浅谈Python协程

    协程 协程,又称微线程,纤程.英文名Coroutine.一句话说明什么是线程:协程是一种用户态的轻量级线程. 协程拥有自己的寄存器上下文和栈.协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈.因此: 协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置. 协程的好处: 无需线程上下文切换的开销 无需原子操作锁定及同步的开销 "原子操作(atomic o

  • 浅谈数据库事务四大特性

    数据库四大特性分别是:原子性.一致性.分离性.持久性.下面我们看看具体介绍. 原子性 事务的原子性指的是,事务中包含的程序作为数据库的逻辑工作单位,它所做的对数据修改操作要么全部执行,要么完全不执行.这种特性称为原子性. 事务的原子性要求,如果把一个事务可看作是一个程序,它要么完整的被执行,要么完全不执行.就是说事务的操纵序列或者完全应用到数据库或者完全不影响数据库.这种特性称为原子性. 假如用户在一个事务内完成了对数据库的更新,这时所有的更新对外部世界必须是可见的,或者完全没有更新.前者称事务

  • 浅谈angular2 组件的生命周期钩子

    本文介绍了浅谈angular2 组件的生命周期钩子,分享给大家,具体如下: 按照生命周期执行的先后顺序,Angular生命周期接口如下所示 名称 时机 接口 范围 ngOnChanges 当被绑定的输入属性的值发生变化时调用,首次调用一定会发生在 ngOnInit之前. OnChanges 指令和组件 ngOnInit 在第一轮 ngOnChanges 完成之后调用. ( 译注:也就是说当每个输入属性的值都被触发了一次 ngOnChanges之后才会调用 ngOnInit ,此时所有输入属性都已

  • 浅谈多线程_让程序更高效的运行

    Java Thread 的一些认识: Java是抢占式线程,一个线程就是进程中单一的顺序控制流,单个进程可以拥有多个并发任务,其底层是切分CPU时间,多线程和多任务往往是使用多处理器系统的最合理方式 进程可以看作一个程序或者一个应用:线程是进程中执行的一个任务,多个线程可以共享资源 一个Java 应用从main 方法开始运行,main 运行在一个线程内,也被称为 "主线程",Runnable也可以理解为Task (任务) JVM启动后,会创建一些守护线程来进行自身的常规管理(垃圾回收,

随机推荐