摘要: 利用heritrix做网络爬虫,当选择以镜像方式存储heritrix下的文档时,如果URL中存在中文或者访问的文件名是中文时,在下载文件的镜像目录路径就会有乱码 阅读全文
posted @ 2012-07-09 14:19 finding_job-sunt 阅读(2089) 评论(2) 推荐(2) 编辑