摘要: 最近应朋友的邀请,帮忙做了个简单的爬虫程序,要求不高,主要是方便对不同网站的爬取进行扩展,获取到想要的数据信息即可。当然,基于数据的后期分析功能是后话,以后的随笔我会逐步的介绍。 开源的爬虫框架比较多,之前我研究过java的nutch,同时它还兼备基于Lucene全文检索的功能,还有Python爬虫 阅读全文
posted @ 2018-05-13 13:17 ITIBB-Shrek 阅读(4304) 评论(5) 推荐(3) 编辑