摘要: 我们在爬取网页的时候,由于需要不断的访问目标服务器,因此给目标服务器带来了很多的压力。 因此,很多访问量大的服务器都会有保护措施,如果检测到我们的行为,可以会禁止我们的ip访问。 这个时候,我们就需要使用到代理ip来进行访问了。 在HttpCLient中,提供了一个org.apache.http.c 阅读全文
posted @ 2017-07-26 13:19 Ouka傅 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 在Linux中,压缩文件的扩展名主要是:[*.tar,*.tar.gz,*.tgz,*.gz,*.Z,*.bz2],虽然,我们知道,在LInux中,文件的扩展名没有什么作用,但是由于在Linux中支持的压缩命令非常的多,为了在解压缩的时候知道用那种方式来解压缩,就需要带上特定的扩展名。 扩展名对应的 阅读全文
posted @ 2017-07-26 11:05 Ouka傅 阅读(2469) 评论(0) 推荐(1) 编辑