一个很粗糙的XXXX

 

改dnsrecon的代码改来改去都获取不到想要的结果,也不知道是不是py中的正则和PHP的有神马不一样的地方,但是用RegexBuddy测的时候是正确的,想不通啊想不通。果断不改了,自己动手PHP写了一个很粗糙的XX,用的X度来获取子域名,也没再改进了,能用就OK了,话说PHP真慢~~

 

<?php
$curl=curl_init();

$page=0;
$output="";

while($page<101)  //这里获取前十页结果,爬的企鹅的子域名
{
	$query="/s?wd=site%3A(qq.com)&pn=".$page."&oq=site%3A(qq.com)&tn=baiduadv&ie=utf-8&";
	$query=$query."rsv_pq=8b9b2ba40000b588&rsv_t=57ebHv8aFiGUGXVP%2ByZ4ek82WFVf1u0C6Vqhy9Pcs9fvkB7pkuKeDI7JllsBPK8&rsv_page=1";
	$page+=10;  //默认每页10条结果,所以翻页加10
	$url="http://www.baidu.com".$query;
	curl_setopt($curl, CURLOPT_URL, $url);
	curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
	$output.=curl_exec($curl);
}
$regexp="/<span class=\"g\">[a-z.0-9]*\.qq\.com\/ <\/span>/i";
$result=array();
preg_match_all($regexp, $output, $result,PREG_PATTERN_ORDER);
print_r($result);

 

posted @ 2015-06-24 15:08  不断学习中的小菜鸟  阅读(326)  评论(0编辑  收藏  举报