摘要: 4.1 实现PageProcessor 这部分我们直接通过GithubRepoPageProcessor这个例子来介绍PageProcessor的编写方式。我将PageProcessor的定制分为三个部分,分别是爬虫的配置、页面元素的抽取和链接的发现。 public class GithubRepo 阅读全文
posted @ 2016-04-10 23:21 long77 阅读(1436) 评论(0) 推荐(0) 编辑