在云那方

首页 新随笔 联系 订阅 管理

<?php
/*
* 抓取网页内容用 PHP 的正则
* 注: $mode中--<title></title>-更改为所需内容(如 $mode = "#<a(.*)</a>#";>获取所有链接)
* print_r($arr);输出获得的所有内容 $arr是一个数组 可根据所需输出一部分(如 echo $arr[1][0];)
* 若要获得所有内容 可去掉
*   $mode = "#<title>(.*)</title>#";
   if(preg_match_all($mode,$content,$arr)){
    print_r($arr);
    echo "<br/>";
    echo $arr[1][0];
    }
   再加上 echo  $content;
*/
$url = "http://www.baidu.com/"; //目标站
$fp = @fopen($url, "r") or die("超时");


$content=file_get_contents($url);

//如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$content);


$mode = "#<title>(.*)</title>#";
if(preg_match_all($mode,$content,$arr)){
  //print_r($arr);
  echo "<br/>";
  echo $arr[1][0];
}
?>

posted on 2010-07-17 11:16  Rich.T  阅读(2195)  评论(0编辑  收藏  举报