Andy 胡

导航

2017年2月5日

网络爬虫2:使用crawler4j爬取网络内容

摘要: https://github.com/yasserg/crawler4j 需要两个包: crawler4j-4.1-jar-with-dependencies.jar slf4j-simple-1.7.22.jar(如果不加,会有警告:SLF4J: Failed to load class "org 阅读全文

posted @ 2017-02-05 14:46 talkwah 阅读(485) 评论(0) 推荐(0) 编辑

网络爬虫1

摘要: 网络爬虫,web crawler(网页蜘蛛,网络机器人,网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序 最简单的网络爬虫:读取页面中所有的邮箱 阅读全文

posted @ 2017-02-05 14:28 talkwah 阅读(171) 评论(0) 推荐(0) 编辑