随笔分类 -  【Java】-- 爬虫

【java爬虫】---爬虫+基于接口的网络爬虫
摘要:爬虫+基于接口的网络爬虫 上一篇讲了【java爬虫】 爬虫+jsoup轻松爬博客,该方式有个很大的局限性,就是你通过jsoup爬虫只适合爬静态网页,所以只能爬当前页面的所有新闻。如果需要爬一个网站所有信息,就得通过接口,通过改变参数反复调该网站的接口,爬到该网站的所有数据信息。 本博客以爬金色财经新 阅读全文
posted @ 2018-08-02 23:13 雨点的名字 阅读(10170) 评论(2) 推荐(6) 编辑
【java爬虫】---爬虫+jsoup轻松爬博客
摘要:爬虫+jsoup轻松爬博客 最近的开发任务主要是爬虫爬新闻信息,这里主要用到技术就是jsoup,jsoup 是一款 Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过 DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。这篇文章就讲 阅读全文
posted @ 2018-07-19 22:50 雨点的名字 阅读(12368) 评论(1) 推荐(3) 编辑


点击右上角即可分享
微信分享提示