PHP学习之PHP代码的优化

PHP虽然是世界上最好的语言,但是它本身作为一门脚本语言,其运行效率一直被人们所诟病。

作为以PHP为开发语言的应用程序而言,PHP程序的性能能影响到整个架构性能的百分之30左右,不会超过百分之50,其余的是硬件的、操作系统的、存储的等等其他性能优化;因此,PHP程序的性能好坏,对于整个系统架构而言,还是很重要的。

PHP的性能优化分为一下三个层次:

这三个层次性能优化的难度依次上升,效果却依次降低。在此,我们重点讨论前两种层次。

PHP代码的优化

多使用PHP内置的函数,少使用PHP代码,且精简PHP代码

PHP的执行流程为:

这个原理是很简单的,PHP是解释型语言,PHP代码得经过好几步转化才能变成最终的机器码,假如PHP代码写的很多,不够精简,转化的步骤就会变长,自然会影响PHP程序的性能。而PHP内置的函数是由C语言编写的,运行速度自然快。

PHP内置函数的执行效率也有优先级,可以尽量使用快的

这个原因也是显而易见的,虽然都是C语言写的程序,但是C实现的方式还是不同的,有的实现方式快一些,有的实现的慢一些,所以调用快的效率肯定会高一点。
例如:

  • array_key_exists效率要比in_array
  • requirerequire_once效率高
  • 单引号''比双引号""效率高

减少PHP魔法函数的使用

PHP的魔法函数用起来很爽,但是既然用的这么爽,那么PHP在底层肯定帮你做了诸多事情,做的这么一堆事情,不能不消耗性能吧。
PHP魔法函数为了让程序员爽,在语言级别帮程序猿做了很多,会带啦性能开销,我们应该看情况酌情使用。

不要使用错误抑制符@

@错误抑制符这玩意儿的实现原理和魔法函数差不多,都是方便了程序猿苦了自己;原理也很简单,就是在添加了错误@符号的前面和后面添加了Opcode,Opcode的作用就是和error_reporting忽略错误一样一样的,然后在添加了@符号的代码之后再添加上一些Opcode,将错误等级恢复。

可以用PHP的Opcode查看扩展vld来查看添加了@符号的代码情况。(vld的使用也很简单,就俩指令vld.active=1vld.execute=0.vld.active=1表示想要用扩展,vld.execute=0.表示只是查看Opcode代码,vld.execute=1.表示要执行php程序。``php -vld.active=1 -vld.execute=0 xxx.php)

合理使用PHP内存,释放掉没用的变量

要尽量合理的使用内存,例如:

  • 从数据库中取字段,只取某个字段,就不要取出全部字段。 select xxx 和 select * 的区别
  • 读取文件,文件使用完后,文件close的问题
  • 使用unset及时释放掉无用的变量。(但是也会有unset不掉的情况)

尽量减少使用正则表达式

正则表达式需要回溯,当正则表达式越长,它回溯的开销就会越大,优化表达式也是个技术活儿,所以建议尽量使用PHP内置的处理函数来替代。

避免循环内做重复的计算

例如:

$str = "hello world";
for ($i = 0; $i<strlen($str); $i ++)
{
    //do something
}

strlen($str)是不是被重复计算了?有意义吗?写在外边不好吗?

避免数据密集型计算

PHP是由C语言来实现的,PHP本身在处理一些计算的时候,额外的开销是很大的,例如它的变量寄存、语言处理,都需要C来实现…PHP的“慢”,不是由于一些特性而“慢”,是整体就慢。所以在处理一些大批量数据例如大批量日志处理,大批量数据分析的时候,是十分不适合的,和C等语言比起来不是一个数量级。

PHP的语言特性决定了PHP不适合做大数据量的计算。
PHP适合做的事:

PHP适合做一个纽带,适合做一些字符串、文本处理。

使用Opcode cache

Opcode是整个PHP中最接近机器码的地方,假如我们对Opcode做一下缓存,就节约了PHP代码解析、编译的开销,在此,我们可以使用一些扩展来对Opcode进行缓存

  • APC。(已经不更新)
  • 鸟哥的yac

PHP周边性能优化

以上就是PHP周边的环境。只有PHP周边的环境也得到了很好的性能优化,才能将PHP的系统架构发挥到极致。

不要使用过多的IO

PHP场景的性能开销次序为:读取内存 < 读取数据库 < 读取文件 < 读取网络数据

PHP是不适合编写IO密集型的程序。

优化网络请求

设置超时时间

  • 连接超时 200ms
  • 读超时 800ms
  • 写超时 500ms

将串行请求并行化

  • 使用curl_multi_*()的函数代替curl
  • 使用swoole扩展(比 curl_multi还要好)

合理的将PHP接口输出压缩

使用gzip可以将PHP接口输出压缩,提高我们的IO,但是压缩的过程需要额外的计算消耗,需要消耗部分CPU性能,需要合理使用;当数据量小于几十kb的时候,用gzip还不如不用,当gzip数据大于100k的时候,压缩是合理的,而且压缩的程度还和数据重复的个数有关,如果重复的多,gizp就压缩的小,如果重复的少,gzip压缩的就稍微大点儿。

最后的解决方案

使用性能优化分析工具

  • Facebook的XHPorf
  • 压力测试工具Apache的ab
  • opcode代码分析工具vld

用PHP扩展代替部分逻辑

这个不用多说,很多大公司都是这么做的。
把很多PHP的library做成.so文件。

使用PHP7

HHVM是由Facebook推出的,用来提升PHPruntime效率的,效果十分明显。但是,就PHP7而言,官方觉得PHP7的engine更胜一筹,所以,如果想要整体提高性能,升级PHP7还是必要的。

其他

常用性能优化方案

1.使用单引号替换双引号,单引号在运行的时候不检查运行引号内部的变量,执行效率是双引号的两倍;
2.使用PHP内置的数组操作方法,PHP内置的数组操作方法的运行效率是自行编写代码的10倍以上;
3.使用字符串函数替换正则函数,例如:使用 str_replace 替换 preg_replace
4.使用isset($a{5})替换strlen($a)>5
5.require_once() 代价昂贵,include 文件时尽量使用绝对路径,因为它避免了PHP去 include_path 里查找文件的速度,解析操作系统路径所需时间会更少。

循环优化方案

1.在执行for循环之前确定最大循环数,不要把count/strlen/sizeof等每次都要重复做的但结果都一样的事情放到for循环的条件语句中,另外最好运用foreach代替for循环;
2.禁止在循环内部查询数据库,应将查询放在循环外部;
3.循环内部不宜使用@操作符;
4.循环内部不宜声明变量,尤其是大变量:对象,解决办法是循环之前预定义需要声明的变量。

 

 

0、用单引号代替双引号来包含字符串,这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册中说echo是语言结构,不是真正的函数,故把函数加上了双引号)。 PS:在单引号中,PHP不会自动搜寻变量、转义字符等,因此效率上快很多。而一般来说字符串是没有变量的,所以使用双引号会导致性能不佳。

1、如果能将类的方法定义成static,就尽量定义成static,它的速度会提升将近4倍。 PS:事实上,function、method、static method的速度不会有太大差异。具体可见“PHP函数的实现原理及性能分析【转载】”一文。

2、$row[’id’] 的速度是$row[id]的7倍。 PS:不太懂,貌似差异只有后者会先判断id这个宏是否存在,如果不存在则自动转变为字符串。

3、echo 比 print 快,并且使用echo的多重参数(译注:指用逗号而不是句点)代替字符串连接,比如echo $str1,$str2。

PS:如果使用echo $str1.$str2 就会需要 PHP 引擎首先把所有的变量连接起来,然后在输出,而echo $str1,$str2,PHP 引擎就会按照循序输出他们

4、在执行for循环之前确定最大循环数,不要每循环一次都计算最大值,最好运用foreach代替。 PS:像count、strlen这样的操作其实是O(1)的,因此不会带来太多消耗,当然避免每次循环都计算是比较好的策略。最好用foreach代替for,这个效率更高,如果考虑到foreach($array as $var)每次拷贝的消耗,可以使用foreach($array as &$var)这样的引用。

5、注销那些不用的变量尤其是大数组,以便释放内存。 PS:如果没有记错的话,unset($array)不会立刻释放内存,但随时释放是个好习惯。

6、尽量避免使用__get,__set,__autoload。

7、require_once()代价昂贵。 PS:require_once和include_once需要判重,因此效率上要低,但是5.2版本后效率问题已经基本解决。

8、include文件时尽量使用绝对路径,因为它避免了PHP去include_path里查找文件的速度,解析操作系统路径所需的时间会更少。 PS:支持,尽量少用iniset()来设置include_path。

9、如果你想知道脚本开始执行(译注:即服务器端收到客户端请求)的时刻,使用$_SERVER['REQUEST_TIME']要好于time()。 PS:$_SERVER['REQUEST_TIME']保存了发起该请求时刻的时间戳,而time()则返回当前时刻的Unix时间戳。

10、函数代替正则表达式完成相同功能。 PS:这种函数是指strtok、strstr、strpos、str_replace、substr、explode、implode等等。

11、str_replace函数比preg_replace函数快,但strtr函数的效率是str_replace函数的四倍。 PS:字符串操作比正则替换要快。

12、如果一个字符串替换函数,可接受数组或字符作为参数,并且参数长度不太长,那么可以考虑额外写一段替换代码,使得每次传递参数是一个字符,而不是只写一行代码接受数组作为查询和替换的参数。 PS:需要考虑到内置函数和用户自定义函数的开销差异,恐怕这种做法得不偿失。

13、使用选择分支语句(译注:即switch case)好于使用多个if,else if语句。 PS:php中switch支持数值和字符串变量,比C的switch要好用,建议使用。

14、用@屏蔽错误消息的做法非常低效,极其低效。 PS:有什么替代方法吗?没有的话还是不得不用的……

15、打开apache的mod_deflate模块,可以提高网页的浏览速度。

16、数据库连接当使用完毕时应关掉,不要用长连接。 PS:在连接之前,最好设置一下相应的超时机制,例如链接超时、读写超时、等待超时等。

17、错误消息代价昂贵。

18、在方法中递增局部变量,速度是最快的。几乎与在函数中调用局部变量的速度相当。

19、递增一个全局变量要比递增一个局部变量慢2倍。

20、递增一个对象属性(如:$this->prop++)要比递增一个局部变量慢3倍。

21、递增一个未预定义的局部变量要比递增一个预定义的局部变量慢9至10倍。

22、仅定义一个局部变量而没在函数中调用它,同样会减慢速度(其程度相当于递增一个局部变量)。PHP大概会检查看是否存在全局变量。

23、方法调用看来与类中定义的方法的数量无关,因为我(在测试方法之前和之后都)添加了10个方法,但性能上没有变化。

24、派生类中的方法运行起来要快于在基类中定义的同样的方法。

25、调用带有一个参数的空函数,其花费的时间相当于执行7至8次的局部变量递增操作。类似的方法调用所花费的时间接近于15次的局部变量递增操作。

26、Apache解析一个PHP脚本的时间要比解析一个静态HTML页面慢2至10倍。尽量多用静态HTML页面,少用脚本。

27、除非脚本可以缓存,否则每次调用时都会重新编译一次。引入一套PHP缓存机制通常可以提升25%至100%的性能,以免除编译开销。

28、尽量做缓存,可使用memcached。memcached是一款高性能的内存对象缓存系统,可用来加速动态Web应用程序,减轻数据库负载。对运算码 (OP code)的缓存很有用,使得脚本不必为每个请求做重新编译。

29、当操作字符串并需要检验其长度是否满足某种要求时,你想当然地会使用strlen()函数。此函数执行起来相当快,因为它不做任何计算,只返回在zval 结构(C的内置数据结构,用于存储PHP变量)中存储的已知字符串长度。但是,由于strlen()是函数,多多少少会有些慢,因为函数调用会经过诸多步骤,如字母小写化(译注:指函数名小写化,PHP不区分函数名大小写)、哈希查找,会跟随被调用的函数一起执行。在某些情况下,你可以使用isset() 技巧加速执行你的代码。

  (举例如下)

  if (strlen($foo) < 5) { echo “Foo is too short”$$ }

  (与下面的技巧做比较)

  if (!isset($foo{5})) { echo “Foo is too short”$$ }

  调用isset()恰巧比strlen()快,因为与后者不同的是,isset()作为一种语言结构,意味着它的执行不需要函数查找和字母小写化。也就是说,实际上在检验字符串长度的顶层代码中你没有花太多开销。 PS:长见识了。

30、当执行变量$i的递增或递减时,$i++会比++$i慢一些。这种差异是PHP特有的,并不适用于其他语言,所以请不要修改你的C或Java代码并指望它们能立即变快,没用的。++$i更快是因为它只需要3条指令(opcodes),$i++则需要4条指令。后置递增实际上会产生一个临时变量,这个临时变量随后被递增。而前置递增直接在原值上递增。这是最优化处理的一种,正如Zend的PHP优化器所作的那样。牢记这个优化处理不失为一个好主意,因为并不是所有的指令优化器都会做同样的优化处理,并且存在大量没有装配指令优化器的互联网服务提供商(ISPs)和服务器。

31、并不是事必面向对象(OOP),面向对象往往开销很大,每个方法和对象调用都会消耗很多内存。

32、并非要用类实现所有的数据结构,数组也很有用。

33、不要把方法细分得过多,仔细想想你真正打算重用的是哪些代码?

34、当你需要时,你总能把代码分解成方法。 PS:分解成方法要适当,行数少使用频率高的方法尽量用直接写代码,可以减少函数堆栈开销;且方法嵌套不宜过深,否则大大影响PHP的运行效率。

35、尽量采用大量的PHP内置函数。

36、如果在代码中存在大量耗时的函数,你可以考虑用C扩展的方式实现它们。

37、评估检验(profile)你的代码。检验器会告诉你,代码的哪些部分消耗了多少时间。Xdebug调试器包含了检验程序,评估检验总体上可以显示出代码的瓶颈。

38、mod_zip可作为Apache模块,用来即时压缩你的数据,并可让数据传输量降低80%。

39、在可以用file_get_contents替代file、fopen、feof、fgets等系列方法的情况下,尽量用file_get_contents,因为他的效率高得多!但是要注意file_get_contents在打开一个URL文件时候的PHP版本问题; PS:这个要记住,尽量使用file_get_contents和file_put_contents,不需要自己判断文件句柄打开是否成功。

40、尽量的少进行文件操作,虽然PHP的文件操作效率也不低的;

41、优化Select SQL语句,在可能的情况下尽量少的进行Insert、Update操作(在update上,我被恶批过);

42、尽可能的使用PHP内部函数(但是我却为了找个PHP里面不存在的函数,浪费了本可以写出一个自定义函数的时间,经验问题啊!); PS:内置函数比用户自定义函数效率高了将近一个数量级。

43、循环内部不要声明变量,尤其是大变量:对象(这好像不只是PHP里面要注意的问题吧?); PS:这个必须的,变量过多或者过大时,每次重分配的开销就无法忽略。

44、多维数组尽量不要循环嵌套赋值;

45、在可以用PHP内部字符串操作函数的情况下,不要用正则表达式;

46、foreach效率更高,尽量用foreach代替while和for循环;

47、用单引号替代双引号引用字符串; PS:晕,这个不就是第一条吗?

48、“用i+=1代替i=i+1。符合c/c++的习惯,效率还高”;

49、对global变量,应该用完就unset()掉;

posted @ 2019-05-07 11:27  随缘盛世  阅读(250)  评论(0编辑  收藏  举报