PHP多线程处理问题

 

近日工作中涉及到项目同时处理多个线程问题时,在网上找到了PHP的pthreads扩展以及curl_multi_init函数,具体如下:

 

一 、windows下安装php真正的多线程扩展pthreads教程

扩展地址:http://docs.php.net/manual/zh/book.pthreads.php
注意事项
php5.3或以上,且为线程安全版本。apache和php使用的编译器必须一致。
通过phpinfo()查看Thread Safety为enabled则为线程安全版。
通过phpinfo()查看Compiler项可以知道使用的编译器。本人的为:MSVC9 (Visual C++ 2008)。


本人使用环境
32位windows xp sp3,wampserver2.2d(php5.3.10-vc9 + apache2.2.21-vc9)。


一、下载pthreads扩展
下载地址:http://windows.php.net/downloads/pecl/releases/pthreads
根据本人环境,我下载的是pthreads-2.0.8-5.3-ts-vc9-x86。
2.0.8代表pthreads的版本。
5.3代表php的版本。
ts表示php要线程安全版本的。
vc9表示php要Visual C++ 2008编译器编译的。
x86则表示32位的


二、安装pthreads扩展
复制php_pthreads.dll 到目录 bin\php\ext\ 下面。(本人路径D:\wamp\bin\php\php5.3.10\ext)
复制pthreadVC2.dll 到目录 bin\php\ 下面。(本人路径D:\wamp\bin\php\php5.3.10)
复制pthreadVC2.dll 到目录 C:\windows\system32 下面。
打开php配置文件php.ini。在后面加上extension=php_pthreads.dll
提示!Windows系统需要将 pthreadVC2.dll 所在路径加入到 PATH 环境变量中。我的电脑--->鼠标右键--->属性--->高级--->环境变量--->系统变量--->找到名称为Path的--->编辑--->在变量值最后面加上pthreadVC2.dll的完整路径(本人的为C:\WINDOWS\system32\pthreadVC2.dll)。


三、测试pthreads扩展

  1. class AsyncOperation extends \Thread {
  2.     public function __construct($arg){
  3.         $this->arg = $arg;
  4.     }
  5.     public function run(){
  6.         if($this->arg){
  7.             printf("Hello %s\n", $this->arg);
  8.         }
  9.     }
  10. }
  11. $thread = new AsyncOperation("World");
  12. if($thread->start())
  13.     $thread->join();
  14. ?>
复制代码

运行以上代码出现 Hello World,说明pthreads扩展安装成功! 


附上一个Thinkphp3.2.2简单例子

  1. <?php
  2. namespace Home\Controller;
  3. class test extends \Thread {
  4.     public $url;
  5.     public $result;
  6.     
  7.     public function __construct($url) {
  8.         $this->url = $url;
  9.     }
  10.     
  11.     public function run() {
  12.         if ($this->url) {
  13.             $this->result = model_http_curl_get($this->url);
  14.         }
  15.     }
  16. }
  17. function model_http_curl_get($url) {
  18.     $curl = curl_init();  
  19.     curl_setopt($curl, CURLOPT_URL, $url);  
  20.     curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);  
  21.     curl_setopt($curl, CURLOPT_TIMEOUT, 5);  
  22.     curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2)');  
  23.     $result = curl_exec($curl);  
  24.     curl_close($curl);  
  25.     return $result;  
  26. }
  27. for ($i = 0; $i < 10; $i++) {
  28.     $urls[] = 'http://www.baidu.com/s?wd='. rand(10000, 20000);
  29. }
  30. /* 多线程速度测试 */
  31. $t = microtime(true);
  32. foreach ($urls as $key=>$url) {
  33.     $workers[$key] = new test($url);
  34.     $workers[$key]->start();
  35. }
  36. foreach ($workers as $key=>$worker) {
  37.     while($workers[$key]->isRunning()) {
  38.         usleep(100);  
  39.     }
  40.     if ($workers[$key]->join()) {
  41.         dump($workers[$key]->result);
  42.     }
  43. }
  44. $e = microtime(true);
  45. echo "多线程耗时:".($e-$t)."秒<br>";  
  46. /* 单线程速度测试 */
  47. $t = microtime(true);
  48. foreach ($urls as $key=>$url) {
  49.     dump(model_http_curl_get($url));
  50. }
  51. $e = microtime(true);
  52. echo "For循环耗时:".($e-$t)."秒<br>";  
复制代码

测试结果如下:
多线程耗时:2.8371710777282714844秒
For循环耗时:10.941586017608642578秒

原文出自:http://www.thinkphp.cn/topic/22676.html

 

二 、curl_multi_init()

<?php
echo date("Y-m-d H:m:s",time());
echo " ";
echo floor(microtime()*1000);
echo "<br>";
$mtime = explode(" ", microtime());
$mtime = $mtime[1].($mtime[0] * 1000);
$mtime2 = explode(".", $mtime);
$mtime = $mtime2[0];
echo $mtime;
echo "<br>";
$urls = array(
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com');
print_r(async_get_url($urls)); // [0] => example1, [1] => example2
echo "<br>";
echo date("Y-m-d H:m:s",time());
echo " ";
echo floor(microtime()*1000);
echo "<br>";
$mtime_ = explode(" ", microtime());
$mtime_ = $mtime_[1].($mtime_[0] * 1000);
$mtime2_ = explode(".", $mtime_);
$mtime_ = $mtime2_[0];
echo $mtime_;
echo "<br>";
echo $mtime_ - $mtime;

function async_get_url($url_array, $wait_usec = 0)
{
if (!is_array($url_array))
return false;
$wait_usec = intval($wait_usec);
$data = array();
$handle = array();
$running = 0;
$mh = curl_multi_init(); // multi curl handler
$i = 0;
foreach($url_array as $url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't print
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
curl_setopt($ch, CURLOPT_MAXREDIRS, 7);
curl_multi_add_handle($mh, $ch); // 把 curl resource 放进 multi curl handler 里
$handle[$i++] = $ch;
}
/* 执行 */
do {
curl_multi_exec($mh, $running);
if ($wait_usec > 0) /* 每个 connect 要间隔多久 */
usleep($wait_usec); // 250000 = 0.25 sec
} while ($running > 0);
/* 读取资料 */
foreach($handle as $i => $ch) {
$content = curl_multi_getcontent($ch);
$data[$i] = (curl_errno($ch) == 0) ? $content : false;
}
/* 移除 handle*/
foreach($handle as $ch) {
curl_multi_remove_handle($mh, $ch);
}
curl_multi_close($mh);
return $data;
}
?>

 

关于curl_multi_init()

一般来说,想到要用curl_multi_init()时,目的是要同时请求多个url,而不是一个一个依次请求,否则就要curl_init()了。

不过,在使用curl_multi的时候,你可能遇到cpu消耗过高、网页假死等现象,可以看看如何解决curl_multi导致网页假死的问题

使用curl_multi的步骤总结如下:

第一步:调用curl_multi_init
第二步:循环调用curl_multi_add_handle
这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle。
第三步:持续调用curl_multi_exec
第四步:根据需要循环调用curl_multi_getcontent获取结果
第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close
第六步:调用curl_multi_close

各函数作用解释:

curl_multi_init()
初始化一个curl批处理句柄资源。

curl_multi_add_handle()
向curl批处理会话中添加单独的curl句柄资源。curl_multi_add_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。

curl_multi_exec()
解析一个curl批处理句柄,curl_multi_exec()函数有两个参数,第一个参数表示一个批处理句柄资源,第二个参数是一个引用值的参数,表示剩余需要处理的单个的curl句柄资源数量。

curl_multi_remove_handle()
移除curl批处理句柄资源中的某个句柄资源,curl_multi_remove_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。

curl_multi_close()
关闭一个批处理句柄资源。

curl_multi_getcontent()
在设置了CURLOPT_RETURNTRANSFER的情况下,返回获取的输出的文本流。

curl_multi_info_read()
获取当前解析的curl的相关传输信息。

 

posted @ 2017-10-23 16:34  zbchina  阅读(3705)  评论(0编辑  收藏  举报