2016 年 9月 2 日随笔档案 - 琪齐

2016年9月2日

爬虫前奏，带你感受爬虫

摘要：爬虫网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。大概知道什么是爬虫了吧，那就带你看看它的好玩之处。 Requests 在带进爬虫的世界中阅读全文

posted @ 2016-09-02 21:03 琪齐阅读(568) 评论(0) 推荐(0) 编辑

爬虫之scrapy框架

摘要：解析 Scrapy解释 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。其可以应用在数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取API所返回的数据(例如 Amazon Associates We 阅读全文

posted @ 2016-09-02 14:16 琪齐阅读(9179) 评论(0) 推荐(0) 编辑

琪齐

导航

公告

爬虫前奏，带你感受爬虫

爬虫之scrapy框架