汤云飞

2015年5月10日

simple_html_dom配合snoopy使用

摘要: https://github.com/samacs/simple_html_domSnoopy的特点是“大”和“全”,一个fetch什么都采到了,可以作为采集的第一步。接下来就需要用simple_html_dom来细细的把想要的部分,扣出来。当然,如果你特别特别擅长正则,而且又钟爱正则,你也可以用正... 阅读全文

posted @ 2015-05-10 22:56 汤云飞 阅读(368) 评论(0) 推荐(0) 编辑
snoopy采集

摘要: Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。Snoopy正确运行需要你的服务器的PHP版本在4以上,并且支持PCRE(Perl Compatible Regular Expressions),基本的LAMP服务都支持。官方:http://sourceforge.ne... 阅读全文

posted @ 2015-05-10 22:36 汤云飞 阅读(470) 评论(0) 推荐(0) 编辑