11 2020 档案

摘要:本脚本主要实现爬取caoliu某图片板块,前3页当天更新的帖子的所有图片,同时把图片下载到对应帖子名创建的文件夹中 爬虫主要通过python xpath来实现,同时脚本内包含,创建文件夹,分割数据,下载等操作 首先,我们分析下caoliu某图片板块的资源链接 贴子对应的页面元素 展开元素,可以看到帖 阅读全文
posted @ 2020-11-15 20:38 小贝书屋 阅读(51349) 评论(0) 推荐(0) 编辑
摘要:比如,我们需要下载下面这张图,图片的网络地址:”https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1605450278851&di=1e008cc52b92b9ff2e18935197035b67&imgtype= 阅读全文
posted @ 2020-11-15 19:56 小贝书屋 阅读(6548) 评论(0) 推荐(0) 编辑
摘要:比如,我们需要在D盘TU目录下创建名称为“test"的文件夹 脚本如下: import os path = r'D://tu' a = "test" os.mkdir(path + './'+a) 执行后 path是定义创建路径 os.mkdir,常见指令 阅读全文
posted @ 2020-11-15 19:34 小贝书屋 阅读(4898) 评论(0) 推荐(0) 编辑