琪齐

空想终日彷徨行动方可无惧!

导航

2016年9月2日

摘要: 爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。大概知道什么是爬虫了吧,那就带你看看它的好玩之处。 Requests 在带进爬虫的世界中 阅读全文

posted @ 2016-09-02 21:03 琪齐 阅读(568) 评论(0) 推荐(0) 编辑

摘要: 解析 Scrapy解释 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates We 阅读全文

posted @ 2016-09-02 14:16 琪齐 阅读(9179) 评论(0) 推荐(0) 编辑