02 2025 档案

摘要:爬虫的目的是爬取数据,是以目标为导向的程序,根据数据类型又分为图片,视频等文件性数据,数据表,统计结果,评论,内容等文字性数据,针对文件性数据,核心点在于在网页元素中找到对应的下载链接,针对文字性数据,需要先区分是动态网页还是静态网页,如果是静态可以直接爬取,如果是动态则需要使用seleium或其他 阅读全文
posted @ 2025-02-24 10:48 小雨淅淅o0 阅读(2) 评论(0) 推荐(0) 编辑
摘要:我使用的pycharm是2024.1版本的: 在IDE中使用pip移植项目安装的依赖库 在终端中输入命令来实现: 打包:pip freeze > requirements.txt 安装:pip install -r requirements.txt 阅读全文
posted @ 2025-02-17 16:15 小雨淅淅o0 阅读(3) 评论(0) 推荐(0) 编辑
摘要:安装chromdriver插件 selenium框架使用需要下载chromdriver插件,版本需要和chrome浏览器的大版本一致,查看浏览器版本方法:chrome://version/ ChromeDriver的主版本号(即120)与Chrome浏览器主版本号匹配就可以了,不需要小版本号完全一致 阅读全文
posted @ 2025-02-10 15:20 小雨淅淅o0 阅读(9) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示