Scrapy框架基本使用_对内容提取出来的url的进一步跟进

  1. 创建项目
    image
  2. 创建爬虫
    image
    image
  3. 项目结构
    image
  4. 规定要爬取的内容,如下
    image
    随便点击一项进入
    image
  5. 对其编写xpath表达式
    5.1 提取描述文字xpath表达式
    image
    5.2 提取链接xpath表达式
    image
    5.3 图片链接提取xpath表达式
    image
  6. 定义Item
    image
    7.编写parse函数
    image
    8.编写管道函数
    image
    10.开启管道
    image
  7. 创建movies文件夹
    image
  8. 启动爬虫
    image
  9. 结果
    image
    image
  • emmm 除开第一个标签有173条数据,只爬取了172条数据,不知道原因出在哪儿。。。
    image
posted @ 2021-09-09 16:19  DaWeiGuo  阅读(299)  评论(0编辑  收藏  举报