随笔档案「2020年2月3日」：寒假大数据学习笔记五 ... - 一夕思醉

2020年2月3日

摘要：今天学习内容为正则表达式，这一块我一整天竟然没有学完。在一开始爬取网页匹配有用的字符串时，我用的是find方法，如下： 1 def find_image(page_url): 2 html = url_open(page_url).decode("utf-8") 3 image_addr = [] 阅读全文

posted @ 2020-02-03 20:53 一夕思醉阅读(134) 评论(0) 推荐(0)

寒假大数据学习笔记四

摘要：今天的学习内容是利用python对图片进行爬取。首先找到一个中意的图片网站，打开开发者工具，仔细寻找有关爬取内容的代码可以很明显的找到.JPG格式的文件，然后直接爬取本网页的源代码，用正则表达式筛选出相应的.JPG文件，读取并保存就可以啦！ from urllib import request 阅读全文

posted @ 2020-02-03 01:26 一夕思醉阅读(199) 评论(0) 推荐(0)

一夕思醉

公告