深入理解 PHP7 中全新的 zval 容器和引用计数机制

最近在查阅 PHP7 垃圾回收的资料的时候,网上的一些代码示例在本地环境下运行时出现了不同的结果,使我一度非常迷惑。 仔细一想不难发现问题所在:这些文章大多是 PHP5.x 时代的,而 PHP7 发布后,采用了新的 zval 结构,相关的资料也比较贫瘠,所以我结合一些资料做了一个总结, 主要侧重于解释新 zval 容器中的引用计数机制 ,如有谬误,还望不吝指教。

PHP7 中新的 zval 结构

明人不说暗话,先看代码!

struct _zval_struct {
 union {
 zend_long     lval;       /* long value */
 double      dval;       /* double value */
 zend_refcounted *counted;
 zend_string   *str;
 zend_array    *arr;
 zend_object   *obj;
 zend_resource  *res;
 zend_reference  *ref;
 zend_ast_ref   *ast;
 zval       *zv;
 void       *ptr;
 zend_class_entry *ce;
 zend_function  *func;
 struct {
  uint32_t w1;
  uint32_t w2;
 } ww;
 } value;
  union {
    struct {
      ZEND_ENDIAN_LOHI_4(
        zend_uchar  type,     /* active type */
        zend_uchar  type_flags,
        zend_uchar  const_flags,
        zend_uchar  reserved)   /* call info for EX(This) */
    } v;
    uint32_t type_info;
  } u1;
  union {
    uint32_t   var_flags;
    uint32_t   next;         /* hash collision chain */
    uint32_t   cache_slot;      /* literal cache slot */
    uint32_t   lineno;        /* line number (for ast nodes) */
    uint32_t   num_args;       /* arguments number for EX(This) */
    uint32_t   fe_pos;        /* foreach position */
    uint32_t   fe_iter_idx;     /* foreach iterator index */
  } u2;
};

对于该结构的详细描述可以参考文末鸟哥的文章,写的非常详细,我就不关公面前耍大刀了,这里我只提出几个比较关键的点:

  1. PHP7 中的变量分为 变量名 和 变量值 两部分,分别对应 zval_struct 和在其中声明的 value
  2. zval_struct.value 中的 zend_long 、 double 都是 简单数据类型 ,能够直接储存具体的值,而其他复杂数据类型储存一个指向其他数据结构的 指针
  3. PHP7 中,引用计数器储存在 value 中而不是 zval_struct
  4. NULL 、 布尔型 都属于 没有值 的数据类型(其中布尔型通过 IS_FALSE 和 IS_TRUE 两个常量来标记),自然也就没有引用计数
  5. 引用 (REFERENCE)变为了一种数据结构而不再只是一个标记位了,它的结构如下:
struct _zend_reference {
  zend_refcounted_h gc;
  zval       val;
}

6.zend_reference 作为 zval_struct 中包含的一种 value 类型,也拥有自己的 val 值,这个值是指向一个 zval_struct.value 的。他们都拥有自己的 引用计数器 。

引用计数器用来记录当前有多少 zval 指向同一个 zend_value 。

针对第六点,请看如下代码:

$a = 'foo';
$b = &$a;
$c = $a;

此时的数据结构是这样的:

$a 与 $b 各拥有一个 zval_struct 容器,并且其中的 value 都指向同一个 zend_reference 结构, zend_reference 内嵌一个 val 结构, 指向同一个 zend_string , 字符串的内容 就储存在其中。

而 $c 也拥有一个 zval_struct ,而它的 value 在初始化的时候可以直接指向上面提到的 zend_string ,这样在拷贝时就不会产生复制。

下面我们就聊一聊在这种全新的 zval 结构中,会出现的种种现象,和这些现象背后的原因。

问题

一. 为什么某些变量的引用计数器的初始值为 0

现象

$var_int = 233;
$var_float = 233.3;
$var_str = '233';
xdebug_debug_zval('var_int');
xdebug_debug_zval('var_float');
xdebug_debug_zval('var_str');
/** 输出 **
var_int:
(refcount=0, is_ref=0)int 233
var_float:
(refcount=0, is_ref=0)float 233.3
var_str:
(refcount=0, is_ref=0)string '233' (length=3)
**********/

原因

在 PHP7 中,为一个变量赋值的时候,包含了两部分操作:

  1. 为符号量(即变量名)申请一个 zval_struct 结构
  2. 将变量的值储存到 zval_struct.value 中 对于 zval 在 value 字段中能保存下的值,就不会在对他们进行引用计数, 而是在拷贝的时候直接赋值 ,这部分类型有:
  • IS_LONG
  • IS_DOUBLE

即我们在 PHP 中的 整形 与 浮点型 。

那么 var_str 的 refcount 为什么也是 0 呢?

这就牵扯到 PHP 中字符串的两种类型:

1.interned string 内部字符串(函数名、类名、变量名、静态字符串):

$str = '233';    // 静态字符串

2.普通字符串:

$str = '233' . time();

对于 内部字符串 而言,字符串的内容是唯一不变的,相当于 C 语言中定义在静态变量区的字符串, 他们的生存周期存在于整个请求期间,request 完成后会统一销毁释放 ,自然也就无需通过引用计数进行内存管理。

二. 为什么在对整形、浮点型和静态字符串型变量进行引用赋值时,计数器的值会直接变为2

现象

$var_int_1 = 233;
$var_int_2 = &var_int;
xdebug_debug_zval('var_int_1');
/** 输出 **
var_int:
(refcount=2, is_ref=1)int 233
**********/

原因

回忆一下我们开头讲的 zval_struct 中 value 的数据结构,当为一个变量赋 整形 、 浮点型 或 静态字符串 类型的值时,value 的数据类型为 zend_long 、 double 或 zend_string ,这时值是可以直接储存在 value 中的。而按值拷贝时,会开辟一个新的 zval_struct 以同样的方式将值储存到相同数据类型的 value 中,所以 refcount 的值一直都会为 0。

但是当使用 & 操作符进行引用拷贝时,情况就不一样了:

  1. PHP 为 & 操作符操作的变量申请一个 zend_reference 结构
  2. 将 zend_reference.value 指向原来的 zval_struct.value
  3. zval_struct.value 的数据类型会被修改为 zend_refrence
  4. 将 zval_struct.value 指向刚刚申请并初始化后的 zend_reference
  5. 为新变量申请 zval_struct 结构,将他的 value 指向刚刚创建的 zend_reference

此时: var_int_2 都拥有一个 zval_struct 结构体,并且他们的 zval_struct.value 都指向了同一个 zend_reference 结构,所以该结构的引用计数器的值为 2。

题外话:zend_reference 又指向了一个整形或浮点型的 value,如果指向的 value 类型是 zend_string,那么该 value 引用计数器的值为 1。而 xdebug 出来的 refcount 显示的是 zend_reference 的计数器值(即 2)

三. 为什么初始数组的引用计数器的值为 2

现象

$var_empty_arr = [1, 2, '3'];
xdebug_debug_zval('var_empty_arr');
/** 输出 **
var_arr:
(refcount=3, is_ref=0)
array (size=3)
 0 => (refcount=0, is_ref=0)int 1
 1 => (refcount=0, is_ref=0)int 2
 2 => (refcount=1, is_ref=0)string '3' (length=1)
**********/

原因

这牵扯到 PHP7 中的另一个概念,叫做 immutable array (不可变数组)。 关于 immutable array 的详细介绍我放到下篇文章中讲,这里我们只需要知道,这样定义的数组,叫做 不可变数组 。

For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.

不可变数组和我们上面讲到的 内部字符串 一样,都是 不使用引用计数 的,但是不同点是,内部字符串的计数值恒为 0,而不可变数组会使用一个 伪计数值 2。

总结

以上所述是小编给大家介绍的 PHP7 中全新的 zval 容器和引用计数机制,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • PHP解耦的三重境界(浅谈服务容器)

    阅读本文之前你需要掌握:PHP语法,面向对象 在完成整个软件项目开发的过程中,有时需要多人合作,有时也可以自己独立完成,不管是哪一种,随着代码量上升,写着写着就"失控"了,渐渐"丑陋接口,肮脏实现",项目维护成本和难度上升,到了难以维持的程度,只有重构或者重新开发. 第一重境界 假设场景:我们需要写一个处理类,能够同时操作会话,数据库和文件系统.我们或许会这么写. 境界特征:可以运行,但是严重耦合 class DB{ public function DB($arg1

  • PHP实现一个轻量级容器的方法

    什么是容器 在开发过程中,经常会用到的一个概率就是依赖注入.我们借助依懒注入来解耦代码,选择性的按需加载服务,而这些通常都是借助容器来实现. 容器实现对类的统一管理,并且确保对象实例的唯一性 常用的容器网上有很多,如PHP-DI. YII-DI等各种实现,通常他们要么大而全,要么高度适配特定业务,与实际需要存在冲突. 出于需要,我们自己造一个轻量级的轮子,为了保持规范,我们基于PSR-11来实现. PSR-11 PSR 是 php-fig 提供的标准建议,虽然不是官方组织,但是得到广泛认可.PS

  • php接口和抽象类使用示例详解

    一. 抽象类abstract class 1 .抽象类是指在 class 前加了 abstract 关键字且存在抽象方法(在类方法 function 关键字前加了 abstract 关键字)的类. 2 .抽象类不能被直接实例化.抽象类中只定义(或部分实现)子类需要的方法.子类可以通过继承抽象类并通过实现抽象类中的所有抽象方法,使抽象类具体化. 3 .如果子类需要实例化,前提是它实现了抽象类中的所有抽象方法.如果子类没有全部实现抽象类中的所有抽象方法,那么该子类也是一个抽象类,必须在 class

  • PHP生成json和xml类型接口数据格式

    php生成接口通信数据 /** * 生成接口数据格式 */ class Response{ /** * [show 按综合方式输出数据] * @param [int] $code [状态码] * @param [string] $message [提示信息] * @param array $data [数据] * @param [string] $type [类型] * @return [string] [返回值] */ public static function show($code, $m

  • PHP 应用容器化以及部署方法

    PHP 是世界上最好的语言. 经典的 LNMP(linux + nginx + php + mysql)环境有很多现成的部署脚本,但是在 Docker 盛行的今天,依然有很多同学在如何部署上有一些列问题,所以这篇简单介绍一下如何使用 Docker 以及 docker-compose 在服务器上部署 php 应用. 首先我们回顾一下过去的 nginx 里 php 配置: location ~ \.php$ { try_files $uri =404; include fastcgi_params;

  • PHP中抽象类、接口的区别与选择分析

    本文实例分析了PHP中抽象类.接口的区别与选择.分享给大家供大家参考,具体如下: 区别: 1.对接口的使用是通过关键字implements.对抽象类的使用是通过关键字extends.当然接口也可以通过关键字extends继承. 2.接口中不可以声明成员变量(包括类静态变量),但是可以声明类常量.抽象类中可以声明各种类型成员变量,实现数据的封装.(另JAVA接口中的成员变量都要声明为public static final类型) <?php abstract class Father { funct

  • php 接口类与抽象类的实际作用

    1.php 接口类:interface 其实他们的作用很简单,当有很多人一起开发一个项目时,可能都会去调用别人写的一些类,那你就会问,我怎么知道他的某个功能的实现方法是怎么命名的呢,这个时候php接口类就起到作用了,当我们定义了一个接口类时,它里面的方式是下面的子类必须实现的,比如 : 复制代码 代码如下: interface Shop { public function buy($gid); public function sell($gid); public function view($g

  • PHP调用wsdl文件类型的接口代码分享

    复制代码 代码如下: <?php // 本类由系统自动生成,仅供测试用途 class IndexAction extends Action {     public function index(){         //#分销商订单提交.修改.取消.查询接口          $wsdl1='http://127.0.0.1:8080/ejfxs/services/order?wsdl';          //#分销商可销售产品接口地址         $wsdl='http://127.0

  • PHP进阶学习之依赖注入与Ioc容器详解

    本文实例讲述了PHP依赖注入与Ioc容器.分享给大家供大家参考,具体如下: 背景 在很多编程语言(例如java)开发中,程序员在某个类中需要依赖其它类的方法,则通常是new一个依赖类再调用类实例的方法,这种开发存在的问题是new的类实例不好统一管理,一旦有修改,牵扯的类会很多. 最早在java的spring提出了依赖注入的思想,即依赖类不由程序员实例化,而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中.目前许多主流PHP框架也使用了依赖注入容器,如ThinkPHP.L

  • PHP容器类的两种实现方式示例

    本文实例讲述了PHP容器类的两种实现方式.分享给大家供大家参考,具体如下: 通过魔术方法实现 class class MagicContainer{ private $ele; function __construct() { $this->ele = []; } function __set($name, $value) { $this->ele[$name] = $value; } function __get($name) { return $this->ele[$name]; }

随机推荐