09 2021 档案

摘要:前面做了个爬表情包的文章,群聊斗神 - Python爬取斗图表情包 - 斗图之神的战斗神。今天又爬取了一些表情包,但是这次的处理方式有些许的不同,就是在查找到网页中所有的img标签后,处理图片url和图片名字的时候有些许不同。前面是通过处理字符串的方式来处理,效率上会慢一些,今天用bs4处理标签的方 阅读全文
posted @ 2021-09-24 19:24 、一叶孤城 阅读(225) 评论(0) 推荐(0) 编辑
摘要:这两天闲着无聊,看到福建疫情,然后想着停课的孩子们在家可能也会很无聊,可能就在家天天手机。所以想着爬些小孩子感兴趣的故事来玩儿。爬了一千多吧。部分截图如下: 这是从网站爬下来的初始格式,没有去更改,对于有强迫症的我来说,文件名加后缀格式就可以了,文件名里有字符串 mp3是咋回事嘛。所以想着批量处理下 阅读全文
posted @ 2021-09-19 16:54 、一叶孤城 阅读(1273) 评论(0) 推荐(0) 编辑
摘要:写爬虫的时候遇到的: 使用BeautifulSoup的时候想,查找类似<div class = "name">的时候,说白了就是根据类来查找字段。 使用方法: soup.findAll(name="div", attrs={"class" :"name"} attrs内应该可以加多个键值对,用逗号隔 阅读全文
posted @ 2021-09-18 19:23 、一叶孤城 阅读(1191) 评论(0) 推荐(0) 编辑
摘要:作为一个斗图狂魔,怎么能在群聊的时候认怂。不服就干,今天来爬一堆表情包,用于群聊的时候斗图使用。斗疯一个算一个,尽显群聊斗神本色。源码开始: """ 用Python爬取斗图表情包 目标网址:https://www.xxx.com/的斗图表情包 """ import requests from bs4 阅读全文
posted @ 2021-09-09 12:42 、一叶孤城 阅读(249) 评论(0) 推荐(0) 编辑
摘要:记录一下,Python简单的下载图片。 import requests #图片地址 url = 'https://qn.doutub.com/1629295801126.jpg' #请求网页 r = requests.get(url) r.raise_for_status() # #打开一个文件作为 阅读全文
posted @ 2021-09-07 16:59 、一叶孤城 阅读(300) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示