.Tang

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2021年3月29日

摘要: ptt = r"http[s]*://[a-zA-Z0-9-./]+(?:jpg|jpeg|png)" 先是爬取到 图片url -> yeild url到piplines中 定义图片下载的专属piplines,类中的3个函数名固定的,是从写方法,注意图片命名 class DownloadImages 阅读全文
posted @ 2021-03-29 17:31 .Tang 阅读(175) 评论(0) 推荐(0) 编辑

摘要: 1.创建一个scrapy项目 scrapy startproject SpiderAnything 2.生成一个爬虫 itcash爬虫名字, itcash.cn爬虫范围 scrapy genspider tb 'taobao.com' # 启动爬虫 or 创建py启动文件 ps:windows可通过 阅读全文
posted @ 2021-03-29 15:17 .Tang 阅读(105) 评论(0) 推荐(0) 编辑