上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: 又是xpath.... 10年前学java就学过了...哈哈哈 要就看w3cschool的教程就行了, **函数部分会用得到:** [https://www.w3school.com.cn/xpath/xpath_functions.asp](https://www.w3school.com.cn/ 阅读全文
posted @ 2023-07-17 11:07 蕝戀 阅读(7) 评论(0) 推荐(0) 编辑
摘要: ```Python import datetime import json import re import requests class Kr36(object): def __init__(self): self.url = "https://36kr.com/information/web_n 阅读全文
posted @ 2023-07-17 11:06 蕝戀 阅读(6) 评论(0) 推荐(0) 编辑
摘要: ```Python import json if __name__ == '__main__': import requests resp = requests.post( url="http://ifanyi.iciba.com/index.php?c=trans&m=fy&client=6&au 阅读全文
posted @ 2023-07-17 11:06 蕝戀 阅读(9) 评论(0) 推荐(0) 编辑
摘要: ```Python import requests url = "https://sam.huat.edu.cn:8443/selfservice/" # 默认不忽略ssl证书,如果有证书问题的网站会报错 # response = requests.get(url) # 设置verify=False 阅读全文
posted @ 2023-07-17 11:05 蕝戀 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 使用proxies参数传递代理信息 ```Python import requests if __name__ == '__main__': proxies = { # 这个字典的key不可以乱写,必须是http和https # 如果你的只有http那就只写http代理,htpps也是相同的道理。 阅读全文
posted @ 2023-07-17 11:05 蕝戀 阅读(58) 评论(0) 推荐(0) 编辑
摘要: ```Python import requests if __name__ == '__main__': # Session对象实现了客户端和服务器端的每次会话保持功能。 session = requests.Session() resp = session.get("http://www.baid 阅读全文
posted @ 2023-07-17 11:04 蕝戀 阅读(6) 评论(0) 推荐(0) 编辑
摘要: """ 方法一:在请求头header中携带Cookie请求头信息(因为本身Cookie就是用请求头传递的....) 方法二:使用cookie参数传递cookie字典 """ from http.cookiejar import Cookie import requests.utils from re 阅读全文
posted @ 2023-07-17 11:02 蕝戀 阅读(1646) 评论(0) 推荐(0) 编辑
摘要: 出现这个问题是因为你系统上在使用代理,然后你的代理又是规则匹配的。 [https://stackoverflow.com/questions/36906985/switch-off-proxy-in-requests-library](https://stackoverflow.com/questi 阅读全文
posted @ 2023-07-17 11:00 蕝戀 阅读(585) 评论(0) 推荐(0) 编辑
摘要: # \[案例]爬取贴吧并保存网页文件 ```python import urllib.parse import requests class TiebaSpider(object): def __init__(self, url, name): self.url = url self.name = 阅读全文
posted @ 2023-07-17 10:57 蕝戀 阅读(16) 评论(0) 推荐(0) 编辑
摘要: # 基本使用 # 发送get请求、获取响应各种请求、响应信息 ```python def fun1(): url = "http://www.baidu.com" resp = requests.get(url) print(resp) # 打印时会发现乱码 # 因为resp默认是自动推算编码的,经 阅读全文
posted @ 2023-07-17 10:54 蕝戀 阅读(6) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 下一页