摘要: 爬虫案例2-爬取视频的三种方式之一:requests篇(1) @目录前言爬虫步骤确定网址,发送请求获取响应数据对响应数据进行解析保存数据完整源码共勉博客 前言 本文写了一个爬取视频的案例,使用requests库爬取了好看视频的视频,并进行保存到本地。后续也会更新selenium篇和DrissionPage篇。当然,爬取图片肯定不止这三种方法,还有基于pytho 阅读全文
posted @ 2024-09-09 21:38 laity17 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 爬虫案例1-爬取图片的三种方式之一:DrissionPage篇(3) 继requests篇和selenium篇,本文是爬取图片的最后一个案例,利用了python第三方库DrissionPage来自动化爬取图片。当然,爬取图片肯定不止这三种方法,还有基于python的scrapy框架,基于node.js的express框架以及基于Java的webmagic框架等等。 DrissionPage和selenium相似,都是基于python的网页自动化工具。不过Drission库的结合了requests和Selenium的优势,既能控制浏览器交互,又能高效地收发数据包。它的主要特点是可以监听网络数据,它可以拦截并解析请求和响应数据包,方便用户进行调试和分析。 阅读全文
posted @ 2024-08-22 22:05 laity17 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 爬虫案例1-爬取图片的三种方式之一:selenium篇(2) 继使用requests库爬取图片后,本文使用python第三方库selenium来进行图片的爬取,后续也会使用同样是自动化测试工具DrissionPage篇来进行图片的爬取。 selenium是一个用于web应用测试的工具集,它可以直接运行在浏览器中,就像真正的用户在操作一样。它主要应用在自动化测试,web爬虫和自动化任务中。selenium提供了很多编程语言的接口,如java,python,c#等。这让开发者可以自己编写脚本来自动化web应用的测试。本文主要介绍selenium在web爬爬取图片的案例。 阅读全文
posted @ 2024-08-20 22:23 laity17 阅读(7) 评论(0) 推荐(0) 编辑