会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
氢气球很漂亮
博客园
首页
新随笔
联系
订阅
管理
2018年3月6日
从抓取Tencent中学习Scrapy
摘要: 一.创建爬虫工程 二.创建爬虫 三.明确需要爬取的内容(各种存储,方便可持续化用) 1.打开MySpider目录下的item.py 2.Item定义结构化数据,用来保存爬取到的数据,类似字典 3.创建TencentItem类 四.设置爬虫初始url,解析数据获取想要的内容和生成爬虫过程中另外生成的u
阅读全文
posted @ 2018-03-06 16:08 氢气球很漂亮
阅读(154)
评论(0)
推荐(0)
编辑
公告