会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小小码农
博客地址已转移至:
https://zhanghuijun0.github.io/
博客园
首页
新随笔
联系
订阅
管理
2015年1月29日
Heritrix个性化设置抓取目标
摘要: 本文是Heritrix的使用的高级篇,针对对Heritrix已经能够运行的码农朋友们!我们在抓取网页的时候,网页的链接中往往会包含有js、css、图片、视频等文件,第一次执行抓取任务的时候,许多农民朋友们可能会发现抓取速度令人着急,可能是由于抓取了太多的不必要的数据文件,尤其是视频文件,少则几十...
阅读全文
posted @ 2015-01-29 21:44 HuijunZhang
阅读(1602)
评论(0)
推荐(0)
编辑
公告
中国