为何说PHP引用是个坑,要慎用

前言

去年我参加了很多次会议,其中八次会议里我进行了相关发言,这其中我多次谈到了 PHP 的引用问题,因为很多人对它的理解有所偏差。在深入讨论这个问题之前,我们先回顾一下引用的基本概念,明确什么是“引用传递”。

在 PHP 中引用意味着用不同的名字访问同一个变量内容,不论你用哪个名字对变量做出了运算,其他名字访问的内容也将改变。

让我们通过代码来加深对此的理解。 首先我们写几个简单的语句,把一个变量赋值给另一个变量,并且改变另一个变量:

<?php
$a = 23;
$b = $a;
$b = 42;
var_dump($a); // int(23)
var_dump($b); // int(42)

这个脚本显示 $a 值仍然为 23  ,而 $b 则等于 42 。出现这个情况的原因是我们得到的是一个拷贝(具体发生了什么稍后讲解。。。)现在我们使用引用来做同样的事情:

<?php
$a = 23;
$b = &$a;
$b = 42;
var_dump($a); // int(42)
var_dump($b); // int(42)
?>

现在 $a 的值也改变成了 42 。 事实上,$a 和 $b 之间没有任何区别,它们都使用了同一个变量容器(又名: zval )。 将这两者分开的唯一方法是使用 unset() 函数销毁其中任何一个变量。

在 PHP 中,引用不仅能用在普通语句中,还能用于函数参数和返回值:

<?php
function &foo(&$param) {
 $param = 42;
 return $param;
}

$a = 23;
echo "\$a before calling foo(): $a\n";
$b = foo($a);
echo "\$a after the call to foo(): $a\n";
$b = 23;
echo "\$a after touching the returned variable: $a\n";
?>

你认为上面的结果是什么呢?—— 没错,就像下面这样:

$a before calling foo(): 23
$a after the call to foo(): 42
$a after touching the returned variable: 42

这里我们初始化了一个变量,并把它作为一个引用参数传给了一个函数。函数改变了它,它有了新值。该函数返回同一个变量,我们更改了返回的变量和它的原始值。。。 等等!它没变,不是吗!? —— 没错,可引用就是这样。 具体发生了如下事情:该函数返回了一个引用,引用了 $a 的变量容器 zval,并且通过 = 赋值操作符为它创建了一个副本。

为了修复这个问题,我们需要添加一个额外的 & 操作符:

$b = &foo($a);

结果和我们所期望的一样:

$a before calling foo(): 23
$a after the call to foo(): 42
$a after touching the returned value: 23

总结一下: PHP 的引用就是同一个变量的别名,想要正确的使用它们可能很难。想要详细了解引用计数,这里有份基础资料,请参阅 手册中的引用计数基本知识

PHP 5 发布时最大的变动是『对象处理方式』。一般我们理解为:

在 PHP 4 中,对象被当成变量来对待,所以当对象作为函数传参时,他们是被复制的。但在 PHP 5 中,他们永远是『引用传参』。

以上的理解并不完全正确。其主要目的是遵循『面对对象模式』:对象传参给函数或者方法后,这个函数发送一个指令给对象(例如调用了一个方法)以此来改变对象的状态(例如对象的属性)。因此传参进去的对象必须为同一个。 PHP 4 的面对对象用户使用『引用传参』来解决这个问题,不过很难做到完美。PHP 5 引进了独立于变量容器的『对象存储器』。当一个对象赋值给变量时,变量不再存储整个对象(属性表和其他的『类』信息),而是存储这个对象所在 存储器的引用 —— 当我们复制一个对象变量时,我们复制的是这个『存储器的引用』。这很容易被误解为『引用』,但是『存储器的引用』与『引用』是完全不同的概念。下面的示例代码有助于我们更好地区分:

<?php
// 创建一个对象和此对象的引用变量
$a = new stdclass;
$b = $a;
$c = &$a;

// 对『对象』进行操作
$a->foo = 42;
var_dump($a->foo); // int(42)
var_dump($b->foo); // int(42)
var_dump($c->foo); // int(42)

// 现在直接改变变量的类型
$a = 42;
var_dump($a); // int(42)
var_dump($b); // object(stdClass)#1719 (1) {
    //   ["foo"]=>
    //   int(42)
    // }
var_dump($c); // int(42)
?>

以上代码中,修改对象的属性会影响到 复制 的变量 $b 和引用的变量 $c。但是在最后区块的代码中,当我们修改 $a 的类型时,引用的 $c 发生了变化,而复制得到的变量 $b 不会发生改变,这是个大多数有面对对象经验的工程师所期待的。

So, 面对对象是唯一使用『引用』的理由,但是现在 PHP 4 已死,你也可以放弃此类用法了。

另一个人们使用『引用』的理由是 —— 这将让代码更快。但是这是错误的,引用并不会使代码执行速度变快,更糟糕的是,很多时候『引用』会让你的代码执行效率更低。

我必须再郑重强调一次:是的,很多时候『引用』会让你的代码执行效率更低。

别的语言的工程师,他们阅读别的语言编码规范,会看到建议在处理大的数据结构或者字串时,使用指针来减小对内存的消耗以提高运行效率。这些工程师误将此概念理解到『引用』上,然而『指针』与『引用』是完全不同的技术模型。PHP 解析器与其他语言不同,在 PHP 中,我们使用『写时复制(copy-on-write)』模型。

在『写时复制』模型里,赋值和函数传参不会触发 复制 动作,你可以理解为多个不同的变量指向同一个『变量容器』,只有当『写』动作发生时,才会触发复制动作。这意味着,即使变量看起来像是『复制』的,本质上却不是。所以当传参一个巨大的变量给某个函数时,并不会对性能造成多大影响。不过此时如果你使用引用传参的话,引用传参会关闭『写时复制』机制,这会导致接下来那些没有使用引用的变量传参会被立刻复制一份。这也不是世界末日,你也可以在所有地方都引用就行了嘛。事实并非如此:PHP 的内部机制依赖于『写时复制』模型,存在很多你无法修改的内部函数传参。
我曾在某处看到过类似下面这样的代码:

<?php
function foo(&$data) {
 for ($i = 0; $i < strlen($data); $i++) {
  do_something($data{$i});
 }
}

$string = "... looooong string with lots of data .....";
foo(string);
?>

显然,上面这段代码的第一个问题是:在循环中调用 strlen() 而不是使用已经计算好的长度。也就是说调用一次 strlen($data) 就可以了的,但是他却调用了很多次。 不同于 C 这类语言, 一般来说,PHP 的字符串都自带了长度,因此也不用进行长度的计算。所以就 strlen() 而言,这还不算太糟糕。 但现在另一个问题是,案例中的这个开发者为了节省时间,传递了一个引用作为参数以显示自己的聪明。 然而,strlen() 期望得到的是一个副本。『写时复制』不能用于引用,因此 $data 将会在 strlen() 调用时被复制,strlen() 将会做一个绝对简单的操作 —— 事实上 strlen() 本来就是 PHP 里最简单的函数之一 —— 紧接着该副本就会被直接销毁。

如果没有使用引用,也就没必要进行复制操作,代码执行也会更快。而且就算 strlen() 支持引用,你也不会因此获得更多好处。

总的来说:

  • 除了 PHP4 的遗留问题,不要在面向对象(OO)中使用引用。
  • 不要使用引用来提升性能。

使用引用来完成事情的第三个问题是:通过参数的引用来返回数据所导致的糟糕的 API 设计。这个问题还是因为那个开发者没有意识到『PHP 就是 PHP 而不是其他语言』所导致的。

在 PHP 中,同一个函数可以返回不同数据类型。—— 因此,你可以在函数执行成功时返回一个字符串,而在失败时返回一个布尔值 false,PHP 也允许返回复杂的结构类型,比如数组和对象。所以在需要返回很多东西的时候,可以将他们打包在一起。另外,异常也是函数返回的一种方式。

使用引用是一件不好的事情,除了引用本身不好,并且还会使性能下降这个事实外,使用引用这种方式会使得代码难以维护。像下面这段代码的函数调用:

do_something($var);

你希望 $var 发生改变吗?—— 当然不会。然而,如果 do_something() 传递的参数是引用,它就可能会改变。

这类 API 的另一个问题是:函数不能链式调用,因而你总会遇到必须使用临时变量的场景。链式调用可能会使可读性降低,但是在许多场景下,链式调用使得代码更加简洁。

关于引用的糟糕的设计决定,我个人最喜欢的一个例子是 PHP 自带的 sort() 函数。sort() 使用一个数组作为引用参数,然后通过引用返回一个排好序的数组。 像常规那样通过值返回一个排好序的数组可能还更好些。当然,这么做是由于历史的原因:sort() 比『写时复制』更早出现。『写时复制』产生于 PHP4,而 sort() 则更早,它早在 PHP 还是作为一种在 Web 上做起事来很方便的东西,而不是真正的成为自己的语言的时候就存在了。

总之: 在 PHP 中,引用是不好的。 不要使用引用。 它们只会惹事生非,另外,不要对使用引用来提升引擎抱有希望。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

您可能感兴趣的文章:

  • php 传值赋值与引用赋值的区别
  • php 引用(&)详解
  • PHP中函数内引用全局变量的方法
  • PHP引用(&)各种使用方法实例详解
  • PHP 引用文件技巧
  • PHP正则表达式的逆向引用与子模式分析
  • php中引用符号(&)的使用详解
  • php引用传值实例详解学习
  • PHP的引用详解
(0)

相关推荐

  • php 引用(&)详解

    在PHP 中引用的意思是:不同的名字访问同一个变量内容. 与C语言中的指针是有差别的.C语言中的指针里面存储的是变量的内容在内存中存放的地址 变量的引用 PHP 的引用允许你用两个变量来指向同一个内容 复制代码 代码如下: <? $a="ABC"; $b =&$a; echo $a;//这里输出:ABC echo $b;//这里输出:ABC $b="EFG"; echo $a;//这里$a的值变为EFG 所以输出EFG echo $b;//这里输出EF

  • php中引用符号(&)的使用详解

    与C语言中的指针是有差别的.C语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用.PHP 的引用允许你用两个变量来指向同一个内容 复制代码 代码如下: $a="ABC"; $b =&$a; echo $a;//这里输出:ABC echo $b;//这里输出:ABC $b="EFG"; echo $a;//这里$a的值变为EFG 所以输出EFG echo $b;//这里输出EFG 函数的传址调用 传址调用我就不多说了 下面直接给出代码 复制代码 代

  • php 传值赋值与引用赋值的区别

    传值赋值:当将一个表达式的值赋予一个变量时,整个原始表达式的值被赋予到目标变量.这意味着,例如,当一个变量的值赋予另一个变量时,改变其中一个变量的值,将不会影响到另一个变量. 复制代码 代码如下: <?php <?php $a=123; $a=123; $b=$a; $b=&$a; $a=321; $a=321; Echo"$a,$b";//显示"321,123" Echo"$a,$b";//显示"321,321&q

  • php引用传值实例详解学习

    引用是什么在 PHP 中引用意味着用不同的名字访问同一个变量内容.这并不像 C 的指针,替代的是,引用是符号表别名.注意在 PHP 中,变量名和变量内容是不一样的,因此同样的内容可以有不同的名字.最接近的比喻是 Unix 的文件名和文件本身--变量名是目录条目,而变量内容则是文件本身.引用可以被看作是 Unix 文件系统中的 hardlink.一:变量的引用 复制代码 代码如下: <?php$a =100;$b = &$a;echo $b;    //这里输出100echo $a;    /

  • PHP 引用文件技巧

    我们知道,java中有包的概念,而.NET中则有更加方便的DLL程序集引用的概念,通过这些以打包形式组合在一起的对象集合,我们可以很方便的在自己的类中引用其他地方定义的类或其他对象,但由于PHP中没有相应的概念,所以在需要引用其他文件中定义的对象时,PHP程序员最常用的两个函数莫过于require_once和include了,通过这两个函数,我们可以使用其他类库中定义的类等对象.但很多人在使用包含相同目录下的其他文件时,仅仅简单使用下面的代码进行文件引用: 复制代码 代码如下: include(

  • PHP的引用详解

    引用是什么 在 PHP 中引用意味着用不同的名字访问同一个变量内容.这并不像 C 的指针,替代的是,引用是符号表别名.注意在 PHP 中,变量名和变量内容是不一样的,因此同样的内容可以有不同的名字.最接近的比喻是 Unix 的文件名和文件本身--变量名是目录条目,而变量内容则是文件本身.引用可以被看作是 Unix 文件系统中的 hardlink. 引用做什么 PHP 的引用允许用两个变量来指向同一个内容.意思是,当这样做时: 复制代码 代码如下: <?php $a =& $b; ?>

  • PHP正则表达式的逆向引用与子模式分析

    正则表达式一个最重要的特性就是将匹配成功的模式的某部分进行存储供以后使用这一能力. 对一个正则表达式模式或部分模式两边添加圆括号()可以把这部分表达式存储到一个临时缓冲区中. 所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容按顺序存储. 存储子匹配的缓冲区编号从1开始,连续编号至最大99个子表达式. 每个缓冲区都可以使用'\n'(或用'$n')访问,其中n为1至99的阿拉伯数字,用来按顺序标识特定缓冲区(子表达式). 例1:最简单最有用的例子是确定文字中连续出现两个相同单词的位置

  • PHP引用(&)各种使用方法实例详解

    php的引用(就是在变量或者函数.对象等前面加上&符号),在PHP 中引用的意思是:不同的名字访问同一个变量内容.与C语言中的指针是有差别的.C语言中的指针里面存储的是变量的内容,在内存中存放的地址. 1.变量的引用PHP 的引用允许你用两个变量来指向同一个内容 复制代码 代码如下: <?    $a="ABC";    $b =&$a;    echo $a;//这里输出:ABC    echo $b;//这里输出:ABC    $b="EFG&quo

  • PHP中函数内引用全局变量的方法

    先看下面的代码: 复制代码 代码如下: <?php $var1 = "#####"; $var2 = "&&&&&"; function global_references($use_globals) { global $var1, $var2; if (!$use_globals) { $var2 =&$var1; //1 } else { $GLOBALS["var2"] =&$v

  • 浅谈PHP中关于foreach使用引用变量的坑

    写PHP好多年,但仍然会犯低级错误,今天遇到个 foreach中引用变量时的坑,PHP版本为 5.6.12 代码如下: <?php $arr = ['a', 'b', 'c', 'd', 'e']; foreach ($arr as $i=>&$a) { $a = $a.'_'. $a; echo $a .'<br>'; } echo '<hr>'; foreach ($arr as $i=>$a) { echo $a .'<br>'; } e

  • 为何说PHP引用是个坑,要慎用

    前言 去年我参加了很多次会议,其中八次会议里我进行了相关发言,这其中我多次谈到了 PHP 的引用问题,因为很多人对它的理解有所偏差.在深入讨论这个问题之前,我们先回顾一下引用的基本概念,明确什么是"引用传递". 在 PHP 中引用意味着用不同的名字访问同一个变量内容,不论你用哪个名字对变量做出了运算,其他名字访问的内容也将改变. 让我们通过代码来加深对此的理解. 首先我们写几个简单的语句,把一个变量赋值给另一个变量,并且改变另一个变量: <?php $a = 23; $b = $

  • SpringBoot中的Thymeleaf用法

    Thymeleaf Thymeleaf是最近SpringBoot推荐支持的模板框架,官网在thymeleaf.org这里. 我们为什么要用Thymeleaf来作为模板引擎呢?官网给了我们一个非常令人信服的解释: Thymeleaf is a modern server-side Java template engine for both web and standalone environments.> 基本写法就像下面这样: <table> <thead> <tr&g

  • vue.js踩坑之ref引用细节点讲解

    目录 ref引用细节点讲解 要点简介:[ 见下文案例 ] 通过ref引用的形式,来操作DOM 步骤如下 重要代码如下 ref引用及插槽 ref引用 ref引用DOM元素 ref引用组件实例 实现标签的按需切换 插槽 匿名插槽 具名插槽 作用域插槽 ref引用细节点讲解 vue.js组件之H5页面,DOM标签或者组件中,通过ref="自定义name名称"引用的细节点 要点简介:[ 见下文案例 ] 使用is=" "解决H5出现的标签解析bug . 子组件中 使用data

  • 浅谈mint-ui 填坑之路

    近期上手vue的移动端项目,舍弃了之前自己相对熟悉的mui框架,改为用饿了么团队为了vue量身定做的mint-ui框架. 之前开发的时候觉得mui的文档就足够坑爹了,但当我开始阅读mint-ui这个文档后才发现自己真是太年轻了... 针对一些自己遇到的问题,特此记录成文档,方便日后使用. swipe组件 因为项目加载eslint的缘故也就没有像之前的项目一样引用swiper框架. 这个轮播图的组件文档实在是不敢恭维(尽管其他的文档也好不到哪里去),官方给出的参数真是少的可怜,一些方法也并没有提到

  • Python创建二维数组实例(关于list的一个小坑)

    0.目录 1.遇到的问题 2.创建二维数组的办法 •3.1 直接创建法 •3.2 列表生成式法 •3.3 使用模块numpy创建 1.遇到的问题 今天写Python代码的时候遇到了一个大坑,差点就耽误我交作业了... 问题是这样的,我需要创建一个二维数组,如下: m = n = 3 test = [[0] * m] * n print("test =", test) 输出结果如下: test = [[0, 0, 0], [0, 0, 0], [0, 0, 0]] 是不是看起来没有一点问

  • SQL Server在AlwaysOn中使用内存表的“踩坑”记录

    前言 最近因为线上alwayson环境的一个数据库上使用内存表.经过大概一个星期监控程序发现了一个非常严重问题这个数据库的日志文件不会截断,已用空间一直在增加(存在定时的每个小时的日志备份),同时内存表数据库文件也无法删除,下面就介绍一下后面我的处理过程,话不多说了,来一起看看详细的介绍吧. 数据库:SQL Server2014 Enterprise Edition (64-bit) 删除文件 使用一个单独非alwayson环境的数据库测试. 一.创建内存表 ---创建内存表文件组 ALTER

  • 学习Angular中作用域需要注意的坑

    Angular作用域 在用angular搭建的网页应用中,作用域(scope)这个概念是贯穿其中的.在angular的视图(view)中的很多指令是会创建一个作用域的,例如 ng-app , ng-controller 等.这个作用域就是我们在写控制器构造函数时注入的 $scope (angular1.2之前的版本),他是视图模型(view model)中的一个概念.我们的数据模型(model)就是定义在作用域中的. Angular作用域的坑 用过angular的人应该都会经过一个过程,就是刚开

  • jQuery版本升级踩坑大全

    背景 -------------------------------------------------------------------------------- jQuery想必各个web工程师都再熟悉不过了,不过现如今很多网站还采用了很古老的jQuery版本.其实如果早期版本使用不当,可能会有DOMXSS漏洞,非常建议升级到jQuery 1.9.x或以上版本.前段时间我就主导了这件事情,把公司里我们组负责的项目jQuery版本从1.4.2升级到了jQuery 1.11.3.jQuery官

  • Xcode 8新特性的使用和遇到的坑

    目前还在用Xcode 7.3 一直没有更新,毕竟可怜了我弄的那么多插件...言归正传,自己从Xcode 8问世就一直在关注,今天偶然看到一篇文章总结的不错,随手转载过来顺便再次整理了一下,在此感谢原著作者! 原文如下: Xcode 8正式版在9月13日已经推送给开发者下载,我也在十一回来之后,就下载了新的Xcode.下载之后就出现了很多编译错误,之前的插件也不能用了,但是发现Xcode8把好多不错的插件功能整合到自身了,感觉这点也挺不错. 每个版本Xcode都会带来很多新特性,Xcode 8也不

随机推荐