会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
奋斗的珞珞
奔跑吧,骚年~
博客园
首页
新随笔
联系
订阅
管理
2016年5月9日
第一节:Scrapy开源框架初探
摘要: Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。 具体开发流程如下: 一、确定待抓取网站 当您需要从某个网站中获取信息,但该网站未提供API或能通过程序获取信息的机制时, Scrapy可以助你一臂之力。 二、定义要抓取的数据 定义我们需要爬取的数据。在Scrapy中, 这是通过 Scr...
阅读全文
posted @ 2016-05-09 10:02 奋斗的珞珞
阅读(480)
评论(0)
推荐(0)
编辑
公告