2024年4月12日
摘要: 1. 命令行 创建 cd xx scrapy startproject <文件夹名> [dir] cd 文件目录 scrapy genspider <文件名> <域名> scrapy crawl <文件名> shell命令 scrapy shell 网址 2. 每个模块 spiders 定义的详细爬 阅读全文
posted @ 2024-04-12 16:54 HelloJacker 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 创建Selector对象 from parsel import Selector html 可以是请求某个网页的源码,也可以是html,xml格式的字符串 selector = Selector(html) .css/.xpath/.re 提取数据 get()\getall() re\re_fris 阅读全文
posted @ 2024-04-12 10:36 HelloJacker 阅读(17) 评论(0) 推荐(0) 编辑