摘要:
之前写过一篇用jsoup爬取csdn博客的文章JAVA爬虫挖取CSDN博客文章 ,当时博主还在上一家公司实习,由于公司办公网络需要代理才能访问外网,那一篇的代码逻辑与代理密切相关,可能有些不熟悉jsoup怎么使用的朋友看了会感觉越看越糊涂,且当时以为爬取所有文章需要用到分页,可能会误导读者。所以今天再次整理那个篇博客的思路,在没有代理的网络的环境下实现代码功能,如果你的也是处在代理才能访问外网的网络,那么参考本文最后一段的解决方案。 阅读全文
搜索
最新评论
- 1. Re:JAVA爬虫挖取CSDN博客文章
- @ 小楉这个案例爬到的内容并没有存入数据库中,只是在控制台打出了相应的信息,如果你有兴趣,可以去CSDN下载代码来运行看看效果!...
- --少年张翠山
- 2. Re:JAVA爬虫挖取CSDN博客文章
- 数据库里吗
- --小楉
- 3. Re:JAVA爬虫挖取CSDN博客文章
- 请问爬取的内容放到了哪里
- --小楉
- 4. Re:记一次培训机构“面试”过程
- ╮(╯▽╰)╭
- --NI_微笑时好美
- 5. Re:人人网面试经历
- 所谓外派就是外包啦~:《北京银河创想信息技术有限公司 外包面试人人网经历》,我一大学同学现在就在58做java开发~
- --邹琼俊