02 2025 档案
摘要:爬虫的目的是爬取数据,是以目标为导向的程序,根据数据类型又分为图片,视频等文件性数据,数据表,统计结果,评论,内容等文字性数据,针对文件性数据,核心点在于在网页元素中找到对应的下载链接,针对文字性数据,需要先区分是动态网页还是静态网页,如果是静态可以直接爬取,如果是动态则需要使用seleium或其他
阅读全文
摘要:我使用的pycharm是2024.1版本的: 在IDE中使用pip移植项目安装的依赖库 在终端中输入命令来实现: 打包:pip freeze > requirements.txt 安装:pip install -r requirements.txt
阅读全文
摘要:安装chromdriver插件 selenium框架使用需要下载chromdriver插件,版本需要和chrome浏览器的大版本一致,查看浏览器版本方法:chrome://version/ ChromeDriver的主版本号(即120)与Chrome浏览器主版本号匹配就可以了,不需要小版本号完全一致
阅读全文