摘要:
今天学习内容为正则表达式,这一块我一整天竟然没有学完。 在一开始爬取网页匹配有用的字符串时,我用的是find方法,如下: 1 def find_image(page_url): 2 html = url_open(page_url).decode("utf-8") 3 image_addr = [] 阅读全文
摘要:
今天的学习内容是利用python对图片进行爬取。 首先找到一个中意的图片网站,打开开发者工具,仔细寻找有关爬取内容的代码 可以很明显的找到.JPG格式的文件,然后直接爬取本网页的源代码,用正则表达式筛选出相应的.JPG文件,读取并保存就可以啦! from urllib import request 阅读全文