摘要:
import requests # (1)网址 url = 'https://www.xslou.com/login.php' # (2)输入登录框-->输入密码框-->点击登录找到php文件-->username data = {'username':'18600605736','password 阅读全文
摘要:
post请求 语法结构 requests.post(url,data=None,json=None) 参数说明 url:需要爬取的网址 data:请求数据 json:json格式的数据 案例:登录小说楼 https://www.xslou.com/loqin.php import requests 阅读全文
摘要:
#百度jk图片 import requests # 请求头 header={"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 阅读全文
摘要:
requests库常用的方法 requests.Request(url) 构造一个请求,支持以下各种方式 requests.get() 发送get请求 requests.post() 发送post请求 requests.head() 获取HTML的头部信息 requests.put() 发送put请 阅读全文
摘要:
错误解析 异常处理主要用到两大类 urllib.error.URLError:用于捕获由urllib.request产生的异常,使用reason属性返回错误原因 urllib.error.HTTPError:用于处理HTTP与HTTPS请求的错误,它有三个属性 code:用于返回的状态码 reaso 阅读全文
摘要:
使用Cookie 为什么需要使用Cookie 解决http的无状态性 使用步骤 实例化MozillaCookieJar(保存Cookie) 创建handler对象(Cookie的处理器) 创建opener对象 打开网页(发送请求获取响应) 保存Cookie文件 案例:获取百度贴吧的Cookie并保存 阅读全文
摘要:
IP代理的使用 IP代理的分类 透明代理:目标网址知道你使用了代理并且知道你的源IP地址 匿名代理:匿名程序比较低 也就是网站知道你使用代理 但是查不出来源IP地址 高匿代理:网站不知道你使用了代理 也不知道源IP地址 IP代理的方式 免费代理IP:https://ip.jiangxianli.co 阅读全文
摘要:
import urllib.request # 获取目标网址 url = 'https://www.baidu.com/' # 添加请求头 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/ 阅读全文
摘要:
post请求 语法结构 requests.post(url,data = None,json = None) 参数说明 url:需要爬取的网站的网址 data:请求数据 json:json格式的数据 案例登录小说楼 https://www.xslou.com/login.php import req 阅读全文
摘要:
print(" 反扒 ") #(headers req 反扒) url = 'https://www.cnblogs.com/' # 用户代理 headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 阅读全文