Fork me on Gitee
摘要: 照着敲了一遍,,, 需要使用"LinkExtrator"和"Rule",这两个东西决定爬虫的走向。 1.allow设置规则的方法:要能够限制在我们想要的url上,不要跟其他的url产生相同的正则表达式即可 2.什么情况下使用follow:如果要爬取页面的时候,需要将满足当前条件的url再进行跟进,那 阅读全文
posted @ 2018-08-20 18:41 MARK+ 阅读(1036) 评论(0) 推荐(0) 编辑