对PHP-GC(垃圾回收)的一点理解

一直对php的垃圾回收机制不明不白故自己开贴记录下。

 

   首先,说到垃圾回收,得先知道什么情况下才能产生垃圾。

 

 如果一个变量refcount在增加,说明在被使用,不是垃圾。

 如果一个变量的refcount减少到0了,说明可以被释放,不是垃圾。

 只有一个变量的refcount在减少,但是减不到0的情况,才是垃圾。    

 一个建立出来后产生的变量容器是放到一个统一的大环境下的,但是array和object稍微有点不同他们本身的变量是在刚才说的大环境下的,但是比如数组的$a[1] = &$a,array和object他们的子类产生的变量容器是存放在这个数组$a自己维护的一个环境下 的,这个时候如果unset($a)之后, 这个is_ref字段还会是1,然后refcount也会是1。

   (refcount=1, is_ref=1)=array (

   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=1, is_ref=1)=...      #...的意思是指向了递归操作了,指向了原本的数组$a
)
(php通过符号表存储变量符号,全局有一个符号表,array和object的子结构有自己维护的符号表)

尽管不再有任何符号指向$a产生的变量容器,因为unset掉了,但是$a之前自己环境里边还在用这个变量容器,所以垃圾就这么产生了,回收不掉。因为没有别的符号指向他了,没办法再unset($a[1])了。
这种造成的内存泄漏吧,平常php脚本执行完毕也就自己关了,但是难免有人用php写一些守护进程很长时间不关闭的程序,就会造成大量内存泄漏。

其次,垃圾怎么被回收
PHP首先会找到这些疑似垃圾,官网上翻成了意思根,怎么找到的太复杂,我个人认为我暂时知道他能找到这些就可以,后续再深入研究。找到这些疑似垃圾的zval之后,把这些疑似垃圾放到
一个根缓冲区,这个根缓冲区能接受的最大疑似垃圾数量默认是10000,(ps:如果要改这个值,需要改php源码并且重新编译后生效,改哪个文件请google)。只有这个根缓冲区满了,装不下了,才开始进行垃圾回收。

说到重点了,怎么删,根据我的理解,分3步:

0.把这些疑似垃圾的refcount这个值全减1,(这块强调下,不是单纯的减1,比如 $a[1] = &$a, $a[2] = &$a , 这种多次引用的,是把每次引用全删掉,所以这种情况下refcount减的是2)为了避免不同根缓冲区都对这个zval做了操作,
所有引用删除也就是减1后,php会标记一下这个zval的引用保证不能再次被删除.

1.再次遍历这些所有的疑似垃圾zval,如果他的refcount 加 1后 不为0,则对其进行refcount 加 1操作, 否则的话,就让他保持0.
2.前两步已经算是把垃圾给找出来了,这一步算是清理,首先,清空这个跟缓存区,循环利用嘛,然后对上一步中,refcount为0的这些真垃圾进行删除销毁,并且收回内存。

我理解这个机制呢,能把内存控制在一个还算理想并且能接收的阈值以下。可以解决循环引用导致的内存泄漏问题。




  

 
posted @ 2019-06-05 17:58  DevelopersAndGamers  阅读(443)  评论(0编辑  收藏  举报