摘要: 使用HttpClient,总是报出“Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.”的WARN日志,定位到HttpClient的... 阅读全文
posted @ 2015-05-21 17:23 243573295 阅读(5332) 评论(0) 推荐(0) 编辑
摘要: 通常情况,通过网络爬虫挖取到的基本为网页静态内容,而动态ajax取数的内容是我个人暂时不知如何一次性把网站中的ajax获取这里介绍的是某个网站中的某一个ajax多某个table刷新,期数据,并提供其他操作,如下载:假设我们需挖取某一个网站:例:某个网站中的那些pdf文件,并下载下来首先:需要分析期网... 阅读全文
posted @ 2015-05-21 16:17 243573295 阅读(849) 评论(0) 推荐(0) 编辑
摘要: 出现次错误的原因主要是在windows系统下创建文件需要遵循其文件名的规则。导致创建文件失败,从而提示filenotfound异常,文件未找到Windows 中文件夹命名规则是:① 文件名或文件夹名可以由1~256个西文字符或128个汉字(包括空格)组成,不能多于256个字符。② 文件名可以有扩... 阅读全文
posted @ 2015-05-21 15:58 243573295 阅读(16819) 评论(0) 推荐(0) 编辑