爬取网页--get()函数

get()函数：使用get()函数时可以发送不携带url参数和携带url参数的GET请求。

语法:getaa(url,params=None,headers=None,cookies=None,verify=True,proxies=Noen,timeout=None,**kwargs)

url:必选参数，表示请求的URL。

params:可选参数，表示请求的查询字符串。

headers:可选参数,表示请求的请求头，该参数只支持字典类型的值。

cookies:可选参数，表示请求的Cookie信息，该参数支持字典或CookieJar类对象。

verify:可选参数，表示是否启用SSL证书，默认值为True。

proxies:可选参数,用于设置代理服务器，该参数只支持字典类型的值。

timeout:可选参数，表示请求网页时设定的超时时长，以秒为单位。

不带参数时，get()函数只需要给url参数传入指定的URL即可。

import requests
base_url = 'https://www.baidu.com/'
response = requests.get(url = base_url)
print(response.status_code)

　　输出结果是:200

带参数时有两种方法

方法一：在调用get()函数之前就赋值给一个变量,然后get()函数只需要给url参数传入指定的URL即可。

import requests
base_url ='https://www.baidu.com/'
ie_param = "ie = utf-8"
wd_param = "wd = python"
full_url = base_url+"?"+ie_param+"&"+wd_param
response = requests.get(full_url)
print(response.status_code)

　　输出:200

方法二:在调用get()函数时将其它参数也直接传入get()函数中

import requests
base_url ='https://www.baidu.com/'
ie_param = "ie = utf-8"
response = requests.get(url = base_url,params=ie_param)
print(response.status_code)

　　输出:200

posted @ 2023-10-08 13:59 小菜阿跃阅读(258) 评论(0) 收藏举报

刷新页面返回顶部

ayue6

爬取网页--get()函数

公告