PHP细节,PHP手册中常见的一句话:该函数是二进制安全的

以下内容转自 http://wuxinjie.github.io/php-02/

在看PHP手册的时候,经常看到一句话”该函数是二进制安全的”。

  • 二进制安全是什么呢?
  • 他是如何实现的?

二进制安全是什么?

先看一段代码:

1 <?php
2 $string1 = "Hello"; 
3 $string2 = "Hello\0Hello"; 
4 echo strcoll($string1, $string2); /*返回0, 由于是非二进制安全,误判为相等 */
5 echo strcmp($string1, $string2);  /*返回<0,不相等*/
6 ?>

这是为什么呢?PHP是基于C实现的,PHP代码都会被zend引擎编译成opcode,最终作为C语言去执行。 而对于c语言‘\0’是字符串的结束符,它读到’\0’就会默认字符读取已经结束,从而抛掉后面的字符串。

1 //这里是C语言哦!
2 main(){  
3     char ab[] = "Hello";  
4     char ac[] = "Hello\0Hello";  
5     strcmp(ab, ac); /*返回0, 由于是非二进制安全,误判为相等 */
6  }

有一个二进制安全的定义,我挺喜欢的:

程序不会对其中的数据做任何限制、过滤、或者假设 —— 数据在写入时是什么样的, 它被读取时就是什么样。

PHP是如何实现二进制安全的?

那么,既然PHP是基于C实现的,C 字符串类型不是二进制安全的,PHP又是如何实现的呢?这就是数据结构的功劳了。 PHP的内核中,是如此定义字符串类型的。

1 struct{
2     char *val;
3     int len;
4 } str;

val是指向字符串内存的指针,len表示该字符串的长度,无论是否遇到“\0”字符,C都按照len长度读取该字符串。

posted @ 2019-03-12 11:22  html55  阅读(501)  评论(0编辑  收藏  举报