【python】爬虫

# 国外路径 pip install request
# 国内源镜像路径(清华) pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests

import requests

key=input("请输入你要查询的内容:")
url = f"http://www.sogo.com/web?query={key}"
header = {
    "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko)"
                  "Chrome/99.0.4844.74 Safari/537.36"
}

resp = requests.get(url, headers=header) #处理了一个小小的反爬

print(resp)
print(resp.text)  # 拿到页面源代码
import requests as requests

url = "https://fanyi.baidu.com/sug"
value = input("请输入关键字:")
keyword = {
    "kw": value
}
# 发送post请求,发送的数据请求必须在字典中,通过data参数进行传递
resp = requests.post(url, data=keyword)
print(resp.json())  #将服务器返回的内容直接转换成json格式
import requests

url = "https://movie.douban.com/j/chart/top_list"

param = {
    "type": 24,
    "interval_id": "100:90",
    "action": "",
    "start": 0,
    "limit": 20
}
headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko)"
                  "Chrome/99.0.4844.74 Safari/537.36"
}

resp = requests.get(url=url, params=param, headers=headers)
# print(resp.request.url)   #检查url是否正确

# 把结果存到文件中
with open("豆瓣喜剧电影.txt", mode="w") as f:
    f.write(str(resp.json()))

# 关闭文件
f.close()
# 爬完一定要关闭
resp.close()

 

posted @   hanyr  阅读(33)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示