会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
张翠山的技术专栏
博客园
首页
新随笔
管理
2017年2月10日
JAVA爬虫挖取CSDN博客文章
摘要: 之前写过一篇用jsoup爬取csdn博客的文章JAVA爬虫挖取CSDN博客文章 ,当时博主还在上一家公司实习,由于公司办公网络需要代理才能访问外网,那一篇的代码逻辑与代理密切相关,可能有些不熟悉jsoup怎么使用的朋友看了会感觉越看越糊涂,且当时以为爬取所有文章需要用到分页,可能会误导读者。所以今天再次整理那个篇博客的思路,在没有代理的网络的环境下实现代码功能,如果你的也是处在代理才能访问外网的网络,那么参考本文最后一段的解决方案。
阅读全文
posted @ 2017-02-10 09:50 程序员张翠山
阅读(2664)
评论(9)
推荐(0)
编辑