【Python】【爬虫】【爬狼】005_爬取数据处理-有的链接缺少了“http”的解决方案(not in)

我认为这一篇文章是没有意义的,说白了就是判断字符串是否包含指定内容。


爬图片链接的时候,发现了一个问题

image-20211215201358198

有的链接缺了http

像我这种使用HTML表格输出的,本来是可以把图片链接显示为图片的,但是有的数据不规范,直接使用会造成有个图片没有正常显示。

所以我们需要对这个进行处理一下

进行一个判断

如果文本包含http字样,则是正常链接,否则是非正常链接

非正常链接我们把缺少的东西给他添加上去即可

if "http" not in fan_img[0]:
    fan_img[0] = "https:" + fan_img[0]

image-20211215203214352

结果如下

image-20211215203227851

posted @ 2021-12-15 20:36  萌狼蓝天  阅读(75)  评论(0编辑  收藏  举报