摘要: 之前写过一篇用jsoup爬取csdn博客的文章JAVA爬虫挖取CSDN博客文章 ,当时博主还在上一家公司实习,由于公司办公网络需要代理才能访问外网,那一篇的代码逻辑与代理密切相关,可能有些不熟悉jsoup怎么使用的朋友看了会感觉越看越糊涂,且当时以为爬取所有文章需要用到分页,可能会误导读者。所以今天再次整理那个篇博客的思路,在没有代理的网络的环境下实现代码功能,如果你的也是处在代理才能访问外网的网络,那么参考本文最后一段的解决方案。 阅读全文
posted @ 2017-02-10 09:50 程序员张翠山 阅读(2650) 评论(9) 推荐(0) 编辑