2015 年 8月 12 日随笔档案 - lvyafei

2015年8月12日

摘要： http://drops.wooyun.org/tips/39150x00 前言网络爬虫（Web crawler），是一种“自动化浏览网络”的程序，或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站，以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容，以... 阅读全文

posted @ 2015-08-12 14:03 lvyafei 阅读(589) 评论(0) 推荐(1) 编辑

关于爬虫的一些看法

摘要：来自百度问题：开发网络爬虫应该怎样选择爬虫框架？有些人问，开发网络爬虫应该选择Nutch、Crawler4j、WebMagic、scrapy、WebCollector还是其他的？这里按照我的经验随便扯淡一下：上面说的爬虫，基本可以分3类： 1.分布式爬虫：Nutch 2.JAVA... 阅读全文

posted @ 2015-08-12 13:59 lvyafei 阅读(547) 评论(0) 推荐(0) 编辑

lvyafei

公告