久染

导航

2018年11月2日 #

(学习日记) 爬取网站图片

摘要: #导入第三方库# coding:utf-8import requests,re#找到需要爬取的网站'http://www.qqjia.com/sucai/sucai1210.htm'#1>获取网站 2>正则表达式匹配不同图片的地址 3>找到所有图片的URL#开发讲究见名识意#1.1 定义一个函数get到urldef get_urls(): #(1)获取网站 response = ... 阅读全文

posted @ 2018-11-02 23:56 久染 阅读(489) 评论(0) 推荐(0) 编辑

(学习日记) Urllib库的使用

摘要: 什么是Urllib: Urllib是python内置的HTTP请求库包括以下模块urllib.request 请求模块urllib.error 异常处理模块urllib.parse url解析模块urllib.robotparser robots.txt解析模块 urlopen 关于urllib.r 阅读全文

posted @ 2018-11-02 00:03 久染 阅读(123) 评论(0) 推荐(0) 编辑