摘要: 今天学习内容为正则表达式,这一块我一整天竟然没有学完。 在一开始爬取网页匹配有用的字符串时,我用的是find方法,如下: 1 def find_image(page_url): 2 html = url_open(page_url).decode("utf-8") 3 image_addr = [] 阅读全文
posted @ 2020-02-03 20:53 一夕思醉 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 今天的学习内容是利用python对图片进行爬取。 首先找到一个中意的图片网站,打开开发者工具,仔细寻找有关爬取内容的代码 可以很明显的找到.JPG格式的文件,然后直接爬取本网页的源代码,用正则表达式筛选出相应的.JPG文件,读取并保存就可以啦! from urllib import request 阅读全文
posted @ 2020-02-03 01:26 一夕思醉 阅读(173) 评论(0) 推荐(0) 编辑