PHP学习之PHP代码的优化
PHP虽然是世界上最好的语言,但是它本身作为一门脚本语言,其运行效率一直被人们所诟病。
作为以PHP为开发语言的应用程序而言,PHP程序的性能能影响到整个架构性能的百分之30左右,不会超过百分之50,其余的是硬件的、操作系统的、存储的等等其他性能优化;因此,PHP程序的性能好坏,对于整个系统架构而言,还是很重要的。
PHP的性能优化分为一下三个层次:
这三个层次性能优化的难度依次上升,效果却依次降低。在此,我们重点讨论前两种层次。
PHP的执行流程为:
这个原理是很简单的,PHP是解释型语言,PHP代码得经过好几步转化才能变成最终的机器码,假如PHP代码写的很多,不够精简,转化的步骤就会变长,自然会影响PHP程序的性能。而PHP内置的函数是由C语言编写的,运行速度自然快。
这个原因也是显而易见的,虽然都是C语言写的程序,但是C实现的方式还是不同的,有的实现方式快一些,有的实现的慢一些,所以调用快的效率肯定会高一点。
例如:
array_key_exists
效率要比in_array
高require
比require_once
效率高- 单引号
''
比双引号""
效率高
PHP的魔法函数用起来很爽,但是既然用的这么爽,那么PHP在底层肯定帮你做了诸多事情,做的这么一堆事情,不能不消耗性能吧。
PHP魔法函数为了让程序员爽,在语言级别帮程序猿做了很多,会带啦性能开销,我们应该看情况酌情使用。
@
错误抑制符这玩意儿的实现原理和魔法函数差不多,都是方便了程序猿苦了自己;原理也很简单,就是在添加了错误@符号的前面和后面添加了Opcode,Opcode的作用就是和error_reporting
忽略错误一样一样的,然后在添加了@符号的代码之后再添加上一些Opcode,将错误等级恢复。
可以用PHP的Opcode查看扩展vld
来查看添加了@符号的代码情况。(vld
的使用也很简单,就俩指令vld.active=1
和vld.execute=0.
, vld.active=1
表示想要用扩展,vld.execute=0.
表示只是查看Opcode代码,vld.execute=1.
表示要执行php程序。``php -vld.active=1 -vld.execute=0 xxx.php)
要尽量合理的使用内存,例如:
- 从数据库中取字段,只取某个字段,就不要取出全部字段。 select xxx 和 select * 的区别
- 读取文件,文件使用完后,文件close的问题
- 使用
unset
及时释放掉无用的变量。(但是也会有unset不掉的情况)
正则表达式需要回溯,当正则表达式越长,它回溯的开销就会越大,优化表达式也是个技术活儿,所以建议尽量使用PHP内置的处理函数来替代。
例如:
$str = "hello world";
for ($i = 0; $i<strlen($str); $i ++)
{
//do something
}
strlen($str)
是不是被重复计算了?有意义吗?写在外边不好吗?
PHP是由C语言来实现的,PHP本身在处理一些计算的时候,额外的开销是很大的,例如它的变量寄存、语言处理,都需要C来实现…PHP的“慢”,不是由于一些特性而“慢”,是整体就慢。所以在处理一些大批量数据例如大批量日志处理,大批量数据分析的时候,是十分不适合的,和C等语言比起来不是一个数量级。
PHP的语言特性决定了PHP不适合做大数据量的计算。
PHP适合做的事:
PHP适合做一个纽带,适合做一些字符串、文本处理。
Opcode是整个PHP中最接近机器码的地方,假如我们对Opcode做一下缓存,就节约了PHP代码解析、编译的开销,在此,我们可以使用一些扩展来对Opcode进行缓存
APC
。(已经不更新)- 鸟哥的
yac
。
以上就是PHP周边的环境。只有PHP周边的环境也得到了很好的性能优化,才能将PHP的系统架构发挥到极致。
PHP场景的性能开销次序为:读取内存 < 读取数据库 < 读取文件 < 读取网络数据
PHP是不适合编写IO密集型的程序。
- 连接超时 200ms
- 读超时 800ms
- 写超时 500ms
- 使用
curl_multi_*()
的函数代替curl
- 使用
swoole
扩展(比curl_multi
还要好)
使用gzip
可以将PHP接口输出压缩,提高我们的IO,但是压缩的过程需要额外的计算消耗,需要消耗部分CPU性能,需要合理使用;当数据量小于几十kb的时候,用gzip
还不如不用,当gzip
数据大于100k的时候,压缩是合理的,而且压缩的程度还和数据重复的个数有关,如果重复的多,gizp
就压缩的小,如果重复的少,gzip
压缩的就稍微大点儿。
- Facebook的
XHPorf
- 压力测试工具Apache的
ab
- opcode代码分析工具
vld
这个不用多说,很多大公司都是这么做的。
把很多PHP的library做成.so
文件。
HHVM
是由Facebook推出的,用来提升PHPruntime
效率的,效果十分明显。但是,就PHP7而言,官方觉得PHP7的engine更胜一筹,所以,如果想要整体提高性能,升级PHP7还是必要的。
其他
常用性能优化方案
1.使用单引号替换双引号,单引号在运行的时候不检查运行引号内部的变量,执行效率是双引号的两倍;
2.使用PHP内置的数组操作方法,PHP内置的数组操作方法的运行效率是自行编写代码的10倍以上;
3.使用字符串函数替换正则函数,例如:使用 str_replace
替换 preg_replace
;
4.使用isset($a{5})
替换strlen($a)>5
;
5.require_once()
代价昂贵,include
文件时尽量使用绝对路径,因为它避免了PHP去 include_path
里查找文件的速度,解析操作系统路径所需时间会更少。
循环优化方案
1.在执行for
循环之前确定最大循环数,不要把count/strlen/sizeof
等每次都要重复做的但结果都一样的事情放到for
循环的条件语句中,另外最好运用foreach
代替for
循环;
2.禁止在循环内部查询数据库,应将查询放在循环外部;
3.循环内部不宜使用@
操作符;
4.循环内部不宜声明变量,尤其是大变量:对象,解决办法是循环之前预定义需要声明的变量。
0、用单引号代替双引号来包含字符串,这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册中说echo是语言结构,不是真正的函数,故把函数加上了双引号)。 PS:在单引号中,PHP不会自动搜寻变量、转义字符等,因此效率上快很多。而一般来说字符串是没有变量的,所以使用双引号会导致性能不佳。
1、如果能将类的方法定义成static,就尽量定义成static,它的速度会提升将近4倍。 PS:事实上,function、method、static method的速度不会有太大差异。具体可见“PHP函数的实现原理及性能分析【转载】”一文。
2、$row[’id’] 的速度是$row[id]的7倍。 PS:不太懂,貌似差异只有后者会先判断id这个宏是否存在,如果不存在则自动转变为字符串。
3、echo 比 print 快,并且使用echo的多重参数(译注:指用逗号而不是句点)代替字符串连接,比如echo $str1,$str2。
PS:如果使用echo $str1.$str2 就会需要 PHP 引擎首先把所有的变量连接起来,然后在输出,而echo $str1,$str2,PHP 引擎就会按照循序输出他们
4、在执行for循环之前确定最大循环数,不要每循环一次都计算最大值,最好运用foreach代替。 PS:像count、strlen这样的操作其实是O(1)的,因此不会带来太多消耗,当然避免每次循环都计算是比较好的策略。最好用foreach代替for,这个效率更高,如果考虑到foreach($array as $var)每次拷贝的消耗,可以使用foreach($array as &$var)这样的引用。
5、注销那些不用的变量尤其是大数组,以便释放内存。 PS:如果没有记错的话,unset($array)不会立刻释放内存,但随时释放是个好习惯。
6、尽量避免使用__get,__set,__autoload。
7、require_once()代价昂贵。 PS:require_once和include_once需要判重,因此效率上要低,但是5.2版本后效率问题已经基本解决。
8、include文件时尽量使用绝对路径,因为它避免了PHP去include_path里查找文件的速度,解析操作系统路径所需的时间会更少。 PS:支持,尽量少用iniset()来设置include_path。
9、如果你想知道脚本开始执行(译注:即服务器端收到客户端请求)的时刻,使用$_SERVER['REQUEST_TIME']要好于time()。 PS:$_SERVER['REQUEST_TIME']保存了发起该请求时刻的时间戳,而time()则返回当前时刻的Unix时间戳。
10、函数代替正则表达式完成相同功能。 PS:这种函数是指strtok、strstr、strpos、str_replace、substr、explode、implode等等。
11、str_replace函数比preg_replace函数快,但strtr函数的效率是str_replace函数的四倍。 PS:字符串操作比正则替换要快。
12、如果一个字符串替换函数,可接受数组或字符作为参数,并且参数长度不太长,那么可以考虑额外写一段替换代码,使得每次传递参数是一个字符,而不是只写一行代码接受数组作为查询和替换的参数。 PS:需要考虑到内置函数和用户自定义函数的开销差异,恐怕这种做法得不偿失。
13、使用选择分支语句(译注:即switch case)好于使用多个if,else if语句。 PS:php中switch支持数值和字符串变量,比C的switch要好用,建议使用。
14、用@屏蔽错误消息的做法非常低效,极其低效。 PS:有什么替代方法吗?没有的话还是不得不用的……
15、打开apache的mod_deflate模块,可以提高网页的浏览速度。
16、数据库连接当使用完毕时应关掉,不要用长连接。 PS:在连接之前,最好设置一下相应的超时机制,例如链接超时、读写超时、等待超时等。
17、错误消息代价昂贵。
18、在方法中递增局部变量,速度是最快的。几乎与在函数中调用局部变量的速度相当。
19、递增一个全局变量要比递增一个局部变量慢2倍。
20、递增一个对象属性(如:$this->prop++)要比递增一个局部变量慢3倍。
21、递增一个未预定义的局部变量要比递增一个预定义的局部变量慢9至10倍。
22、仅定义一个局部变量而没在函数中调用它,同样会减慢速度(其程度相当于递增一个局部变量)。PHP大概会检查看是否存在全局变量。
23、方法调用看来与类中定义的方法的数量无关,因为我(在测试方法之前和之后都)添加了10个方法,但性能上没有变化。
24、派生类中的方法运行起来要快于在基类中定义的同样的方法。
25、调用带有一个参数的空函数,其花费的时间相当于执行7至8次的局部变量递增操作。类似的方法调用所花费的时间接近于15次的局部变量递增操作。
26、Apache解析一个PHP脚本的时间要比解析一个静态HTML页面慢2至10倍。尽量多用静态HTML页面,少用脚本。
27、除非脚本可以缓存,否则每次调用时都会重新编译一次。引入一套PHP缓存机制通常可以提升25%至100%的性能,以免除编译开销。
28、尽量做缓存,可使用memcached。memcached是一款高性能的内存对象缓存系统,可用来加速动态Web应用程序,减轻数据库负载。对运算码 (OP code)的缓存很有用,使得脚本不必为每个请求做重新编译。
29、当操作字符串并需要检验其长度是否满足某种要求时,你想当然地会使用strlen()函数。此函数执行起来相当快,因为它不做任何计算,只返回在zval 结构(C的内置数据结构,用于存储PHP变量)中存储的已知字符串长度。但是,由于strlen()是函数,多多少少会有些慢,因为函数调用会经过诸多步骤,如字母小写化(译注:指函数名小写化,PHP不区分函数名大小写)、哈希查找,会跟随被调用的函数一起执行。在某些情况下,你可以使用isset() 技巧加速执行你的代码。
(举例如下)
if (strlen($foo) < 5) { echo “Foo is too short”$$ }
(与下面的技巧做比较)
if (!isset($foo{5})) { echo “Foo is too short”$$ }
调用isset()恰巧比strlen()快,因为与后者不同的是,isset()作为一种语言结构,意味着它的执行不需要函数查找和字母小写化。也就是说,实际上在检验字符串长度的顶层代码中你没有花太多开销。 PS:长见识了。
30、当执行变量$i的递增或递减时,$i++会比++$i慢一些。这种差异是PHP特有的,并不适用于其他语言,所以请不要修改你的C或Java代码并指望它们能立即变快,没用的。++$i更快是因为它只需要3条指令(opcodes),$i++则需要4条指令。后置递增实际上会产生一个临时变量,这个临时变量随后被递增。而前置递增直接在原值上递增。这是最优化处理的一种,正如Zend的PHP优化器所作的那样。牢记这个优化处理不失为一个好主意,因为并不是所有的指令优化器都会做同样的优化处理,并且存在大量没有装配指令优化器的互联网服务提供商(ISPs)和服务器。
31、并不是事必面向对象(OOP),面向对象往往开销很大,每个方法和对象调用都会消耗很多内存。
32、并非要用类实现所有的数据结构,数组也很有用。
33、不要把方法细分得过多,仔细想想你真正打算重用的是哪些代码?
34、当你需要时,你总能把代码分解成方法。 PS:分解成方法要适当,行数少使用频率高的方法尽量用直接写代码,可以减少函数堆栈开销;且方法嵌套不宜过深,否则大大影响PHP的运行效率。
35、尽量采用大量的PHP内置函数。
36、如果在代码中存在大量耗时的函数,你可以考虑用C扩展的方式实现它们。
37、评估检验(profile)你的代码。检验器会告诉你,代码的哪些部分消耗了多少时间。Xdebug调试器包含了检验程序,评估检验总体上可以显示出代码的瓶颈。
38、mod_zip可作为Apache模块,用来即时压缩你的数据,并可让数据传输量降低80%。
39、在可以用file_get_contents替代file、fopen、feof、fgets等系列方法的情况下,尽量用file_get_contents,因为他的效率高得多!但是要注意file_get_contents在打开一个URL文件时候的PHP版本问题; PS:这个要记住,尽量使用file_get_contents和file_put_contents,不需要自己判断文件句柄打开是否成功。
40、尽量的少进行文件操作,虽然PHP的文件操作效率也不低的;
41、优化Select SQL语句,在可能的情况下尽量少的进行Insert、Update操作(在update上,我被恶批过);
42、尽可能的使用PHP内部函数(但是我却为了找个PHP里面不存在的函数,浪费了本可以写出一个自定义函数的时间,经验问题啊!); PS:内置函数比用户自定义函数效率高了将近一个数量级。
43、循环内部不要声明变量,尤其是大变量:对象(这好像不只是PHP里面要注意的问题吧?); PS:这个必须的,变量过多或者过大时,每次重分配的开销就无法忽略。
44、多维数组尽量不要循环嵌套赋值;
45、在可以用PHP内部字符串操作函数的情况下,不要用正则表达式;
46、foreach效率更高,尽量用foreach代替while和for循环;
47、用单引号替代双引号引用字符串; PS:晕,这个不就是第一条吗?
48、“用i+=1代替i=i+1。符合c/c++的习惯,效率还高”;
49、对global变量,应该用完就unset()掉;