从PHP代码分析PHP 的GC(垃圾回收) 机制

  众所周知, PHP 引擎本身是用 C 写的,提到 C 不能不提的就是 GC(垃圾回收).通过 PHP 手册 我们了解到, PHP 引擎会自动进行 GC 动作.那么我们不禁要问,到底它是怎么回收的, & 引用操作是不是指针, unset() 了一个变量时它是不是真的被回收了呢?这些看似手册有提及的问题,如果仔细分析会发现,远没有那么简单泛泛.也许有人会跳出来说:看 PHP 源码不就知道了.是的,等你通读了 PHP 源码后这个问题肯定不在话下了,然本篇要仅从 PHP 本身来分析这些看似平常却被忽视的小细节,当然了,其中难免水平所限,有所疏漏,热烈欢迎广大 phper 来共同讨论.

首先咱先看到例子,最简单不过的执行流程了:

 

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   echo $b ."n";
10 
11   ?>

不用说 php -f gc.php 输出结果非常明了:

1 I am test.

好,下一个:

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   $b = 'I will change?';
10 
11   echo $a ."n";
12 
13   echo $b ."n";
14 
15   ?>

执行结果依然很明显:

1 I will change?
2 
3 I will change?

君请看:

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   unset($a);
10 
11   echo $a ."n";
12 
13   echo $b ."n";
14 
15   ?>

是不是得想一下下呢?

1 Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 8
2 
3   I am test.

有点犯迷糊了吗?

君再看:

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   unset($b);
10 
11   echo $a ."n";
12 
13   echo $b ."n";
14 
15   ?>

其实如果 Example 3 理解了,这个与之异曲同工.

1 I am test.
2 
3 Notice: Undefined variable: b in /usr/local/www/apache22/data/test/gc.php on line 9

君且看:

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   $a = null;
10 
11   echo '$a = '. $a ."n";
12 
13   echo '$b = '. $b ."n";
14 
15   ?>

猛的第一感觉是什么样的?

1 $a =
2 
3 $b =

  没错,这就是输出结果,对 PHP GC 已有深入理解的 phper 不会觉得有什么奇怪,说实话,当我第一次运行这段代码时很意外,却让我对 PHP GC 有更深刻的理解了.那么下面与之同工的例子自然好理解了.

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   $b = null;
10 
11   echo '$a = '. $a ."n";
12 
13   echo '$b = '. $b ."n";
14 
15   ?>

OK,如果上面的例子的结果对看官来说无任何细节可言,那您可关闭本窗口了,欢迎有空再来!

  下面我们来详细分析 GC 与引用.

  1. 所有例子中,创建了一个变量,这个过程通俗一点讲:是在内存中开辟了一块空间,在里面存放了一个字符串 I am test. . PHP 内部有个符号表,用来记录各块内存引用计数,那么此时会将这块内存的引用计数 加 1,并且用一个名为 $a 的标签(变量)指向这块内存,方便依标签名来操作内存.

  2. 对变量 $a 进行 & 操作,我的理解是找到 $a 所指向的内存,并为 $b 建立同样的一引用指向,并将存放字符串 I am test. 的内存块在符号表中引用计数 加 1.换言之,我们的脚本执行到这一行的时候,存放字符串 I am test. 的那块内存被引用了两次.这里要强调的是, & 操作是建立了引用指向,而不是指针, PHP 没有指针的概念!同时有人提出说类似于 UNIX 的文件软链接.可以在一定程度上这么理解: 存放字符 I am test. 的那块内存是我们的一个真实的文件,而变量 $a 与 $b 是针对真实文件建立的软链接,但它们指向的是同一个真实文件. So, 我们看到,在 Example 2 中给 $b 赋值的同时, $a 的值也跟着变化了.与通过某一软链操作了文件类似.

  3. 在 Example 3 与 4 中,进行了 unset() 操作.根据实际的执行结果,可以看出: unset() 只是断开这个变量对它原先指向的内存的引用,使变量本身成为没有定义过空引用,所在调用时发出了 Notice ,并且使那块内存在符号表中引用计数 减 1,并没有影响到其他指向这块内存的变量.换言之,只有当一块内存在符号表中的引用计数为 0 时, PHP 引擎才会将这块内存回收.

这意味着什么?

看看下面的代码与其结果:

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   unset($a);
10 
11   unset($a);
12 
13   unset($a);
14 
15   echo '$a = '. $a ."n";
16 
17   echo '$b = '. $b ."n";
18 
19   ?>
20 
21   Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 10
22 
23   $a =
24 
25   $b = I am test.

 

第一次 unset() 的操作已经断开了指向,所以后继的操作不会对符号表的任何内存的引用记数造成影响了.

  4. 通过 Example 5 & 6 可以明确无误得出: 赋值 null 操作是相当猛的,它会直接将变量所指向的内存在符号号中的引用计数置 0, 那这块内存自然被引擎回收了,至于何时被再次利用不得而知,有可能马上被用作存储别的信息,也许再也没有使用过.但是无论如何,原来所有指向那块内存变量都将无法再操作被回收的内存了,任何试图调用它的变量都将返回 null.

 

 1 <?php
 2 
 3   error_reporting(E_ALL);
 4 
 5   $a = 'I am test.';
 6 
 7   $b = & $a;
 8 
 9   $b = null;
10 
11   echo '$a = '. $a ."n";
12 
13   echo '$b = '. $b ."n";
14 
15   if (null === $a)
16 
17   {
18 
19   echo '$a is null.';
20 
21   } else
22 
23   {
24 
25   echo 'The type of $a is unknown.';
26 
27   }
28 
29   ?>
30 
31 
32   $a =
33 
34   $b =
35 
36   $a is null.

综上所述,充分说明了为什么我们在看开源产品源码的时候,常看到一些比较大的临时变量,或使用完不再调用的重用信息都会被集中或显示的赋值为 null 了.它相当于 UNIX 中直接将真实文件干掉了,所有指向它的软链接自然成了空链了.

  之前在讨论到这些细节点时有很多想当然的念头,在实际的执行了测试代码后才发现: 哦,原来如此!

  纸上得来终觉浅,绝知此事须躬行.

 

原文链接:http://www.jz123.cn/text/1629408.html

 

 

 

 

 

 

 

posted @ 2012-07-23 15:15  gameboy90  阅读(261)  评论(0编辑  收藏  举报