会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
汤云飞
博客园
首页
新随笔
联系
订阅
管理
公告
2015年5月10日
simple_html_dom配合snoopy使用
摘要: https://github.com/samacs/simple_html_domSnoopy的特点是“大”和“全”,一个fetch什么都采到了,可以作为采集的第一步。接下来就需要用simple_html_dom来细细的把想要的部分,扣出来。当然,如果你特别特别擅长正则,而且又钟爱正则,你也可以用正...
阅读全文
posted @ 2015-05-10 22:56 汤云飞
阅读(368)
评论(0)
推荐(0)
编辑
snoopy采集
摘要: Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。Snoopy正确运行需要你的服务器的PHP版本在4以上,并且支持PCRE(Perl Compatible Regular Expressions),基本的LAMP服务都支持。官方:http://sourceforge.ne...
阅读全文
posted @ 2015-05-10 22:36 汤云飞
阅读(470)
评论(0)
推荐(0)
编辑