夜雨JC

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年12月9日

摘要: 1、目标地址 http://quotes.toscrape.com 将页面的文章内容和作者爬下来,并保存到json文件里面。 下面代码: 用到的工具:scrapy ,xpath选择器,json,codecs编码 爬虫代码: class ScrapeSpider(scrapy.Spider): nam 阅读全文
posted @ 2019-12-09 15:43 夜雨JC 阅读(350) 评论(0) 推荐(0) 编辑